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VECTEUKS PE aONAOE ET/QU P WRESSION 

PREPARATION ET UTILISATION 

La presente invention concerne un nouveau plasmide de levure, ainsi que 
de nouveaux vecteurs de clonage et/ou d'expression derives de celui-ci, leur 
5 preparation et leur utilisation, notamment pour la production de proteines 
recombinantes. Linvention concerne aussi les cellules hotes recombinees contenant 
de tels vecteurs. 

Plus particulferement, la presente invention concerne tout ou partie d'un 
nouveau plasmide isole a partir de la levure Kluyveromyces waltii ou d'un d6riv6 
10 de celui-ci, et les vecteurs de clonage et/ou d'expression construits a partir de 
celui-ci. 

Au cours des dix dernieres annfees, la levure est apparue comme un 
microorganisme hote tres prometteur pour la production de proteines heterologues. 
En particulier, la mise en evidence par Beggs et al (Nature 2Z5 (1978) 

15 104) du plasmide 2\i et de vecteurs derives de celui-ci a ete Tune des clfcs du 
developpement actuel de l'etude g&ietique et moleculaire de la levure 
Saccharomyces cerevisiae . Depuis, le systeme 2\i a permis d'introduire et 
d'exprimer des g£nes heterologues dans la levure afin d'obtenir des proteines 
d^nteret pharmaceutique ou agro-^limentaire. Cependant, le plasmide 2\x et ses 

20 derives ne peuvent se repliquer efficacement que dans les levures appartenant & 
Tespfece S.cerevisiae et a quelques espfeces proches de celle-ci. Ce syst&ne ne peut 
done pas etre utilise pour la manipulation genetique dans la plupart des especes de 
levure. Notamment, il n'est pas utilisable dans les levures dont les proprietes 
physiologiques, distinctes de celles de S.cerevisiae . permettraient des applications 

25 nouvelles et/ou des exploitations industrielles plus performantes. 

Differents laboratoires ont done recherche d'autres plasmides dans des 
especes variees de levure. Ainsi, plusieurs plasmides circulaires ont et& trouves 
chez la levure du genre Zygosaccharomvces. et notamment les plasmides pSRl et 
pSR2 (Toh-e et al, J. Bacteriol. 151 (1982) 1380) ; pSBl, pSB2, pSB3 et pSB4 

30 (Toh-e et aL, J. Gen. Microbiol., 12Q (1984) 2527) ; et pSMl (Utatsu et al., J. 
Bacteriol. 162 (1987) 5537). Un plasmide circulaire a 6galement &6 trouv6 chez 
Kluweromvces drosophilarum : pKDl (Falcone et al, Plasmid 15 (1986) 248). 

Tous ces plasmides presentent des caracteristiques communes avec le 
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plasmide 2\i, et notamment des sequences repetees inversees, et l'existence sous 
deux formes isomeriques possibles due a un systeme de recombinaison site- 
specifique. 

Cependant, ces plasmides presentent toujours l'inconvenient d'avoir un 
5 spectre d'hote etroiL Ainsi, en raison de leur specificite vis-a-vis des especes notes 
de levure, ces plasmides ne peuvent etre utilises que dans un nombre limite de 
souches. 

La presente invention resulte de la mise en evidence d'un plasmide naturel 
de la levure Tniiywmmvces waltii . Ce plasmide, nomme pKWl, est le premier 

10 plasmide naturel connu de cette espece de levure. Purifie a partir de la souche 
Hwaltii CBS 6430, ce plasmide a ete cartographie au moyen d'enzymes de 
restrictions, et la carte resultante est presentee sur la figure 1. 

Un objet de 1'invention reside done dans le plasmide pKWl isole a partir 
de la souche K.waltii CBS6430, ou tout fragment ou derive de celui-ci. 

15 Par derive, on entend au sens de 1'invention les plasmides qui, en depit de 

quelques modifications, conservent les proprietes du plasmide de depart. 
Notamment, les modifications peuvent prendre la forme de mutations ou de 
deletions portant sur des regions d*une importance relative. H peut s'agir egalement 
d'insertions ou de suppressions, comme par exemple de sites de clonage. 

20 Par fragment de pKWl. on entend notamment les differents elements 

genetiques de ce plasmide. Plus preferentiellement, comme elements genetiques de 
pKWl, on peut titer notamment les genes de structure ou des parties de ceux-ci, 
des sequences promotrices fonctionnelles, les sequences repetees inversees (DO, ou 
encore les sequences permettant la replication (origine de replication) ou conferant 

25 la stabilite au plasmide (locus de stabilite). 

En effet, l'etude structurale du plasmide pKWl a permis de mettre en 
evidence des analogies avec le plasmide 2y de S rerevisiae. Ainsi, 4 genes de 
structure ont ete mis en evidence (voir figure 2), ainsi qu'une origine de replication. 
Par ailleurs, le clonage de pKWl dans E. coli a permis d'isoler 4 types de plasmides 

30 recombines, correspondant a 2 formes isomeriques du plasmide pKWl (les formes 
A et B) donees dans le vecteur pKan21 dans les deux orientations possibles (le 
vecteur pKan21 est decrit dans l'exemple 3.1). Ces deux formes sont representees 
sur la figure 1. L'existence de deux formes isomeriques indique la presence de 
sequences repetees inversees. L'etude a ainsi montre que le plasmide pKWl 
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contient une paire de sequences r§p6t6es inversees de 0,3 kb chacune, et deux 
sequences uniques de 2,5 et 2,3 kb, dont l'orientation distingue les 2 formes 
isomeriques A et B. La taille moleculaire du plasmide pKWl est done de 5,5 kb 
environ. Differents sites de restriction ont 6t6 mis en Evidence et, a titre d'exemple, 
5 les sites uniques suivants : EcoRI, SphI, Sail, Clal, Nhel et Bgll. 

La sequence nucleotidique complete du plasmide pKWl a Sgalement 6te 
d&erminee (figure 3). L'absence d'homologie entre cette sequence et celle de 
plasmides connus a ete demontr6e, notamment par des experiences d'hybridation 
(voir exemple 2). L'absence d'hybridation en conditions de stringence moder6e est 
10 caract&ristique de cette difference de sequence. 

Dans un mode pr6f6re, l'invention a pour objet un plasmide comprenant 
tout ou partie de la sequence presentee a la figure 3 ou d'un derive de celle-ci. 

Par ailleurs, la Demanderesse a fegalement montre qu'il est possible 
d'utiliser le plasmide pKWl ou des fragments de celui-ci pour construire des 
15 vecteurs de clonage et/ou depression particulierement stables. 

Un autre objet de la pr6sente invention reside done dans des vecteurs de 
clonage et/ou ^expression caracterises en ce qu'ils comprennent tout ou partie du 
plasmide pKWl de K.waltii CBS 6430 represents a la figure 1, ou d'un derive de 
celui-ci. 

20 Un objet plus particulier de l'invention consiste en un vecteur de clonage 

et/ou depression caracterise en ce qu'il comprend un element g6n6tique au moins 

du plasmide pKWl. 

En raison du spectre d'hote du plasmide pKWl, les vecteurs de l'invention 

peuvent Stre utilises dans des especes autres que l'hote naturel K. waltii . 
25 lis peuvent notamment etre utilises pour la transformation d'especes tres 

variees, notamment d'esptees de levures. 

Differents types de vecteurs ont 6te construits a partir de pKWl t differents 

au niveau de la taille du fragment provenant de pKWl, et done des Elements 

fonctionnels issus de pKWl. 
30 Un objet encore plus particulier de l'invention consiste en un vecteur de 

clonage et/ou d'expression caracterise en ce qu'il comprend 1'origine de replication 

du plasmide pKWl. 

D'autres constructions peuvent etre preparees, contenant des fragments 

plus ou moins importants, permettant d'6tudier l'influence des differents elements 
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de pKWl sur la stabilite des vecteurs, leur specif icite d'hote, et leur efficacite pour 
repression de genes heterologues. En particulier, des vecteurs d'expression 
peuvent etre elaborSs a partir des differents elements genetiques du plasmide pKWl 
(origine de replication, sequences repetees inversees, gSnes de structure, regions 
5 promotrices ,.), que Ton peut introduire dans des plasmides connus pour ameliorer 
leurs performances ou leur conferer de nouvelles proprietes. De la meme f agon, des 
vecteurs peuvent etre obtenus en ajoutant des elements au plasmide pKWl, ou en 
remplagant certains elements genetiques de pKWl par des elements provenant 
d'autres plasmides. Ainsi, des vecteurs peuvent etre obtenus en substituant par 
10 exemple l'origine de replication de pKWl par l'origine de replication du plasmide 
2\i de S. cerevisiae ou du plasmide pKDl de Kluyveromvces. ou par un replicon 
chromosomique (ARS) d'une levure (exemple KARS de K.lactis) . De la meme 
fagon, des vecteurs peuvent etre obtenus en substituant le locus de stabilite de 
pKWl par celui du plasmide 2\i de S. cerevisiae ou du plasmide pKDl de 
15 ]EC1uyveromvces . II peut etre particulierement interessant de reaJiser des vecteurs 
hybrides comprenant des elements des plasmides pKDl et pKWl. 

Avantageusement, les vecteurs de l'invention comprennent l'intSgralite du 
plasmide pKWl tel que repr&ente a la figure 1. 

Preferentiellement, les vecteurs de l'invention comprennent le plasmide 
20 pKWl lin6arise a un site de restriction fonctionellement neutre. 

Par site de restriction fonctionellement neutre, on entend au sens de la 
presente invention un site de restriction au niveau duquel U est possible d'inter- 
rompre la structure du plasmide sans alt&rer ses proprietes de replication et de 
stabilite. 

25 En particulier, il peut s'agir de sites presents sur le plasmide pKWl . A titre 

d'exemple, on peut citer notamment les sites Clal(l); Pstl(4608); ou EcoRV(3072) 
tels que representes sur la figure 1. 

II peut egalement s'agir de sites introduits artificiellement sur le plasmide 
pKWl, ou rendus uniques. Dans ce cas, les sites sont preferentiellement introduits 
30 dans des regions intergeniques du plasmide, et notamment dans la region situee 
entre les genes B et D ou dans celle situee entre le gene D et TIR2. 

Avantageusement, selon la presente invention, le plasmide pKWl est 
linearis§ au niveau d'un site de restriction unique. 

Un site particulierement interessant a cet 6garjd est le site unique Clal 
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localise en position 1 sur la figure 1. La Demanderesse a en effet montrfc que ce site 
permettait d'utiliser le plasmide pKWl pour construire les vecteurs de clonage et/ou 
d'expression, en introduisant a ce niveau, par exemple, des fragments d'ADN 
heterologue, tout en maintenant la replication stable du vecteur obtenu. Ce resultat 
5 est surprenant dans la mesure ou le site Clal est localise dans le gene de structure B. 

^utilisation de tels sites de clonage neutres permet done d'obtenir des 
vecteurs trfcs stables, capables de se maintenir dans les cellules transformees, meme 
en l'absence de toute pression de selection. 

Avantageusement, les vecteurs de Tinvention contiennent en outre une 
10 sequence d'ADN h&6rologue comprenant un gene de structure au moins, sous le 
controle de signaux permettant son expression. 

Les signaux permettant l'expression du ou des genes de structure peuvent 
Stre constitues par un ou plusieurs elements choisis parmi les promoteurs, les 
terminateurs ou les signaux de secr§tion. II est entendu que ces signaux sont choisis 
15 en fonction de Thote utilise, du g&ie de structure et du resultat recherche. En 
particulier il peut etre preferable dans certains cas d'utiliser un promoteur regulable, 
permettant le decouplage entre les phases de croissance de Thote et d'expression du 
ou desdits genes de structure. De m§me, 1'utilisation d'un peptide signal (signal de 
secretion) peut permettre d'augmenter les taux de production de la proline 
20 recherchee, et faciliter Tetape de purification. 

Preferentiellement, les promoteurs utilises sont derives de genes de levure. 
D'un interet tout particulier sont les promoteurs d&rivgs de genes glycolytiques des 
levures du genre Saccharomvpes ou Kluweromyces . Notamment, on peut citer les 
promoteurs des genes codant pour la phosphoglycerate kinase de S.cerevisiae 
25 (EQK). la Glyceraldehyde-3-phosphate deshydrogenase (GPP) , les enolases 
(ENO)> ou les alcool-deshydrogenases (ADH ). On peut egalement citer des 
promoteurs derives de genes foitement exprimes tels que le gene de la lactase 
(LAC4) ou de la phosphatase acide (PHQ5) . 

Par ailleurs, ces regions peuvent etre modifiees par mutag6nese, par 
30 exemple pour ajouter des elements supplementaires de controle de la transcription, 
tels que notamment des regions UAS ("Upstream Activating Sequence"). 

Le gene de structure qui peut etre introduit dans les vecteurs de Tinvention 
code preferentiellement pour un polypeptide d'intfret pharmaceutique ou 
agroalimentaire. A titre d'exemple, on peut citer les enzymes (tels que notamment 
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la superoxide dismutase, la catalase, les amylases, les lipases, les amidases, la 
chymosine etc.), les derives sanguins (tels que la sSrum-albumine, Talpha- ou la 
b&a-globine, le facteur vm, le facteur IX, le facteur van Willebrand, la 
fibronectine, l'alpha-1 antitrypsine etc.), 1'insuline et ses variants, les lymphokines 
5 [telles que les interleukines, les interferons, les facteurs de stimulation des colonies 
(G-CSF, GM-CSF, M-CSF...), le TNF, le TRF etc.], les facteurs de croissance (tels 
que lliormone de croissance, l'erythropoietine, le FGF, l'EGF, le PDGF, le TGF 
etc.), les apolipoproteines, ou encore des polypeptides antigeniques pour la 
realisation de vaccins (hepatite, cytomegalovirus, Eppstein-Barr, herpes etc.). 

10 Dans un mode particulier de realisation de l'invention le gene de structure 

peut etre un gene resultant de la fusion de plusieurs sequences d'ADN. II peut s'agir 
notamment d'un gene cod ant pour un polypeptide hybride, contenant par exemple 
une partie active assocife § une partie stabilisatrice. A titre d'exemple, on peut citer 
les fusions entre Falbumine ou des fragments d'albumine et un recepteur ou une 

15 partie d'un recepteur de virus (CD4, etc.) . 

Dans un autre mode de realisation, la sequence d'ADN heterologue peut 
comprendre plusieurs genes de structure, et notamment des genes intervenant, au 
niveau genetique ou biochimique, dans la biosynth&e d'un metabolite. Le 
metabolite peut en paniculier etre un antibiotique, un acide amine ou une vitamine. 

20 Dans un mode particulier de realisation, les vecteurs de Tinvention 

contiennent en outre : 

- un replicon E.coli et/ou 

- au moins un marqueur de selection. 

Ces elements permettent de manipuler de maniere beaucoup plus aisee les 
25 vecteurs de Tinvention. 

Un autre objet de Tinvention concerne les cellules recombinees contenant 
un vecteur tel que d6fini ci-avant. 

Les cellules recombinees sont preferentiellement choisies parmi les 

levures. 

30 La Demanderesse a montre que les vecteurs de rinvention pouvaient en 

effet etre utilises aussi bien dans K.waltii d'hote naturel de pKWl) que dans des 
levures d'especes ou meme de genres differents. Notamment, ils peuvent etre 
utilises dans d'autres Klvuveromvces ou dans Saccharomvces. Par ailleurs, lorsque 
la souche K. waltii CBS6430 est utilisee comme cellule hote, des recombinaisons 
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homologues entre les vecteurs de Tinvention et le plasmide pKWl resident peuvent 
affecter la stabilite des vecteurs, et ainsi diminuer les performances du couple 
hote/vecteur. Afin d'ameliorer encore la stabilite des vecteurs de Tinvention dans un 
tel couple hote/vecteur, la demanderesse a prepare une souche K. waltii pKWl" 
5 (KW18). Cette souche permet d ! optimiser Tutilisation industrielle des vecteurs de 
Tinvention (voir exemple 4). 

Differentes techniques peuvent etre utilis6es pour introduire les vecteurs 
de Tinvention dans les cellules hotes. En particulier, la transformation (Bianchi et 
al.. Cunr. Genet. 12 (1978) 185) et l'electroporation (Delorme. Appl. Environ. 
10 Microbiol. 155 (1989) 2242) donnent de bons rfesultats. II est clair toutefois que 
Tinvention n'est pas limitee a une technique particuliere. 

Un objet de Tinvention reside egalement dans un proc6d6 de preparation 
d'un polypeptide selon lequel on cultive une cellule recombinee telle que definie 
plus haut et on recupere le polypeptide produit Plus particulierement, le pnx6d6 de 
15 Tinvention permet la production de proteines d'interet pharmaceutique ou 
agroalimentaire, telles que celles indiquees ci-avant Plus specifiquement, le 
procede de Tinvention est adapte a la production d'albumine humaine et de ses 
variants ou precurseurs. 

Dans le cas ou les genes de structure interviennent dans la biosynthese d'un 
20 metabolite, les cellules recombinees peuvent 6galement etre utilisees directement 
dans un procedfi de bioconversion. 

D'autres avantages de la presente invention apparaTtront § la lecture des 
exemples qui suivent, qui doivent etre consideres comme illustratifs et non 
limitatifs. 

25 LEGENDF DES Flfi! JRRft 

Rgure 1 : Carte de restriction du plasmide pKWl. Les sequences r6p§tees inversees 
ainsi que les genes de structure A-D sont indiques. Les positions indiquees pour les 
sites de restriction correspondent au premier nucleotide reconnu par Tenzyme. 
Figure 2 : Etude des phases ouvertes du plasmide pKWl. Les elements genetiques 
30 indiqufes sont localises aux positions suivantes par rapport a la sequence presentee 
figure 3 : Gene A : nucleotides 1454 a 2755 ; Gene B : nucleotides 4948 a 54 ; 
Gene C : nucleotides 389 a 1309 sur le brin complementaire ; Gene D : nucleotides 
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3444 a 4313 sur le brin comptementaire ; IR1 : nucleotides 53 a 368 ; IR2 : 
nucleotides 2713 a 3028. 

Figure 3 : Sequence nucleotidique du plasmide pKWl. La sequence representee 
correspond a la forme B du plasmide. La position 1 correspond au premier 
5 nucleotide de la sequence reconnue par Tenzyme Clal. Le plasmide pKWl a 6t§ 
fragmente par des enzymes de restriction et les fragments ont ete clones dans 
pTZ18R (Pharmacia). Les sequences des segments clones ont ete determinees par 
la rnethode de Sanger sur les 2 brins. 

Figure 4 : Cartes de restriction des plasmides navettes YIPS et pKan21. Ap : Gene 
10 de resistance a Tampicilline ; Tc : Gene de resistance a la tetracycline ; Km : Gene 
de resistance a la kanamycine (G418) ; LacZ : Gene de structure de la B-galactosi- 
dase. 

Figure 5 : Strategic de construction des vecteurs pBNAl, pNEA2, pBNBl/A3, 

pNEBl, pXXY2 et pXXK3. Voir aussi tableau 1. 
15 Figure 6 : Carte de restriction du vecteur pXXJG. 

Figure 7 : Strategie de construction des vecteurs pKWCll, pKWSl et pKWS14. 

Figure 8 : Etude de la stability des vecteurs pKWCll et pXXK3 dans la souche 

K.waltii KW18. Dans chaque cas, un clone transforme a ete cultive en milieu YPG 

non selectif pendant le nombre de generations indique, puis des aliquots de culture 
20 ont ete etales sur boites de milieu YPG gelosS avec et sans G418, afin de 

determiner le nombre total des cellules et le nombre de cellules resistant a G418. La 

stabilite correspond au % de cellules resistantes. 

Figure 9 : Strategie de construction du vecteur d'expression pXPHOS. 
Abreviations : P = promoteur, T = terminateur, ss = signal de secretion, CIP = Calf 
25 Intestinal Phosphatase, Km = kanamycine, E = EcoRI, H = Hindin, S = Sail, B = 
BamHI, Sm = Smal. 

Figure 10 : Cartes de restriction des vecteurs pXKN18 et pXPHOS. Legende : voir 
figure 9. 

Figure 11 : Detection immunologique de TIL18 produite par K.waltii. Les mar- 
30 queurs de poids moleculaire (KDa) sont indiques a gauche. Puits 1 : IL-1B de 
reference (100 ng) ; Puits 2 : Surnageant de culture du transformant pXKN18 (sans 
cassette IL-1B) ; Puits 3 : Surnageant de culture du transformant pXPHOS traite par 
Tendo-N- acetylglucosamidase H ; Puits 4 et 5 : Surnageants des cultures des 
transformants pXPHOS en milieu LPi et HPi respectivement. 
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Figure 12 : Strategie de construction du plasrnide pYG65. 
Figure 13 : Strategie de construction du plasrnide pYG70. 

Figure 14 : Strategie de construction du plasrnide pYG141. aph : gene codant pour 
l'aminoglycoside 3'-phosphotransferase, conferant la resistance a la kanamycine; 
5 ik : gene codant pour la B-lactamase conferant la resistance a Tampicilline. 
Figure 15 : Strategie de construction du plasrnide pYG142. 
Tableaux 1 et 2 : Composition de vecteurs derives de pKWl selon Tinvention. (*) 
Sites de clonage. 

Tableaux 3, 4 et 5 : Transformation par des vecteurs de rinvention respectivement 
10 de SiCgrevisiae. K.waltii et de differentes souches de Kluweromvces. La stabilite 
des transformants est exprimee par le pourcentage de cellules Ura+ apres 10 gene- 
rations de croissance dans le milieu non-selectif YPD. Les souches isonucleaires 
K.waltii pKW1 + et pKW1 ~ sont CBS 6430 et KW18 respectivement. 

TEClfNIQVE? QENFRALES PE C LQ NAQE 

15 Les m&hodes classiques de biologie moleculaire telles que la centri- 

fugation d'ADN plasmidique en gradient de chlorure de cesium - bromure d'ethi- 
dium, la digestion par les enzymes de restriction, l'electrophorese sur gel, T61ec- 
troelution des fragments d'ADN & partir de gels d'agarose, la transformation dans 
E.coli. etc, sont decrites dans la litterature (Maniatis et ah, "Molecular Cloning : a 

20 Laboratory Manual", Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 
1986 ; Ausubel et al., (eds.), "Current Protocols in Molecular Biology", John Wiley 
& Sons, New York 1987). 

La mutagenese dirigee in vitro par oligodesoxynucleotides est effectuee 
selon la methode developpee par Taylor et al. (Nucleic Acids Res. 12 (1985) 8749- 

25 8764) en utilisant le kit distribue par Amersham. Le sSquengage de nucleotides est 
realise selon la technique des dideoxy decrite par Sanger et al. (Proc. Natl. Acad. 
Sci. USA, 24 (1977) 5463-5467). L'amplification enzymatique de fragments 
d*ADN specif iques est effectute par reaction de PCR ("Polymerase-catalyzed Chain 
Reaction") dans les conditions decrites par Mullis et Faloona (Meth. Enzym., 155 

30 (1987) 335-350) et Saiki et al (Science 2211 (1985) 1350-1354), en utilisant un 
M DNA thermal cycler" (Perkin Elmer Cetus) en suivant les recommandations du 
fabricant. 
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PTCEMPLEg 

1) Isolqment et pyrificmipn jfe pKWJ 

La souche CBS 6430 est cultivee dans 2 litres de milieu YPG (Yeast 
extract 1 %, Bactopeptone 1 %, Glucose 2 %) avec agitation a 26°C pendant envi- 
5 ron 18 heures. Les cellules en phase stationnaire precoce sont recoltees par centri- 
fugation. On obtient habituellement 13 a 15 grammes de masse celiulaire par litre. 
Les cellules sont lavees avec 150 ml de sorbitol 1M contenant 30 mg de Zymolyase 
20T (Kirin Breweries Co., Tokyo). Apres incubation a 30°C pendant 1 heure, on 
ajoute a la suspension de protoplastes 5 ml de sodium dodecylsulfate a 10 % et 
10 5 ml de EDTA a 0.5M, pH 7,0. Le melange est immSdiatement agite 
vigoureusement, et incube a 50°C pendant 1 a 2 heures. On ajoute au lysat 1'acetate 
de potassium a la concentration finale de 1 M et le melange est maintenu dans la 
glace pendant 2 heures. Les precipites formes sont elimines par centrifugation 
(Sorvall SS34, 15 000 tpm, 30 minutes). Le surnageant auquel 2 volumes d'ethanol 
15 a 95 % sont ajoutes est refroidi dans la glace afin de precipiter les acides 
nucl§iques. Les precipites sont collectes par centrifugation, laves avec Tethanol a 
70 %. seches sous vide, et enfin dissouts dans 40 ml de 5 x TE (lx TE est Tris-HCl 
10 mM, EDTA ImM, pH 8). Apres addition de 40 g de CsCl et 5 ml de bromure 
d'ethidium (solution stock de 10 mg/ml), le melange est centrifuge a 60 000 tpm 
20 pendant 6 heures (Beckman, rotor 60 Ti). La bande fluorescente de l'ADN 
plasmidique se trouve au-dessous de la bande majeure d , ADN chromosomique. 
UADN du plasmide est collecte et soumis au second cycle de centrifugation dans 
CsCl/bromure d'ethidium. L'ADN plasmidique collecte est melange avec un 
volume d'isopropanol prealablement equilibre avec CsCl 4M pour eliminer ie 
25 bromure d'ethidium. Apres plusieurs extractions par l'isopropanol, la solution 
d'ADN est dialys6e centre 1 x TE. Le volume de la solution peut etre reduit par 
dialyse contre le polyethylene-glycol 6 000 en paillettes. 

2) Sequenyage et etudes d'homologies 

Le plasmide pKWl a ete sequence en utilisant la methode decrite par 
30 Sanger et al (Proc. Natl. Acad. Sci. USA 24 (1977) 5463-5467). La sequence com- 
plete est indiquee sur la figure 3. 

L'absence d'homologie entre cette sequence et celle de plasmides connus a 
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ete determinee par des experiences d'hybridations moleculaires : pKWl est marque 
au 32 P, et hybride avec les plasmides suivants, prealablement immobilises sur un 
filtre de nitrocellulose : 

- plasmide 2\x de S. cerevisiae. 

5 - pSRl, pSB3 et pSB4 de Z. rouxii. 

- pSBl et pSB2 de Z. bailii. et 

- pKDl de K. drosophilarum. 

L'hybridation a ete realisee dans des conditions de stringence moderee (0,6 
M Na+, 65°C, 18 heures); aucun des plasmides n'a donnS un signal positif 
10 d'hybridation. 

Les autres plasmides circulaires (pSBl, pSB4) dont les sequences n'ont pas 
encore ete decrites, sont egalement differents de pKWl, par la taille moleculaire. 
par la longueur des repetitions inverses et par leurs especes hotes. 

3) Construction de vecteurs de elonage derives de pKWl , 

15 Deux types de molecules recombinees ont &e construits a partir de pKWl. 

3.1. Dans le premier type, differents fragments de pKWl (correspondant 
par exemple aux elements genetiques de pKWl) ont ete introduits dans des 
vecteurs navette, et notamment dans les vecteurs Ylp5 (Struhl et al., Proc. Nat. 
Acad. Sci USA 26 (1979) 1035) et pKan21 , representes sur la figure 4. 

20 Le plasmide pKan21 a et6 construit par insertion du gene ajtfi (Genblock, 

Pharmacia) conferant la resistance a la kanamycine (G418) sous forme d ! un 
fragment AccI de 1.25 kpb, dans le site Narl du plasmide pUC19 (Viera et 
Messing, Gene J9 (1982) 259). pKan21 contient done, en plus de ajdl, le gene Ida 
conferant la resistance a Tampicilline et Torigine de replication de ColEl 

25 permettant la replication dans E. Coli . Les levures transformees par les vecteurs 
derives de pKan21 peuvent etre detectees par leur croissance sur milieu contenant 
200|ig/ml de geneticine (G418). 

Le plasmide YIp5 est un derive du plasmide pBR322 dans lequel le gene 
URA3 de SrC^visiag a ete insere comme marqueur de selection. La levure 

30 transformee par les derives de Ylp5 est detectee par sa croissance sur un milieu 
sans uracile. Dans ce dernier cas, la levure bote est une auxotrophe deficiente en 
orotidine-monophosphate carboxylase de la voie de synthese de Turacile. 
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Les vecteurs de ce premier type sont pBNAl, pNEA2, pBNBl/A3. 
pNEBl. pXXY2 et pXXK3 (tableau 1 et figure 4). 

- Vecteur pBNAl 

pKWl a &e digerfe par Bglll et Nhel (Cf figure 5) et les fragments d'ADN 
5 sont separes par electrophorese. Le fragment de 2,4 kpb est recupere et insere par 
ligation entre les sites uniques BamHI et Nhel dans le gene de resistance a la 
tetracycline du plasmide YIp5 (Yanish-Peron et aL, Gene 33, 1985, 103-119), 
celui-ci etant prealablement digere par BamHI et Nhel et repurifie. Les extremites 
Bglll et BamHI sont compatibles pour ligation specifique. E. coli transform^ par le 

10 melange de ligation est seleetionne sur le milieu LB gelose contenant l'ampicilline. 
L'insertion est verifiee par la rSplique des transformants sur le milieu LB gelose 
contenant la tetracycline, ceux-ci etant sensibles a cet antibiotique. La structure du 
plasmide est verifiee par extraction de l'ADN a partir de transformants individuels 
et son analyse par les enzymes de restriction. A titre d'exemple, le plasmide pBNAl 

15 digere par PstI produit 3 fragments de 3,28, 3,15 et 1,36 kpb : la double digestion 
PsO/Nhel donne 4 fragments de 3,15, 2,3, 1,36 et 1 ,0 kpb. 

- Vecteur pNEA2 

Le fragment Nhel-EcoRI de 2,0 de pKWl (Cf figure 5) est isole et insere 
entre les deux sites uniques Nhel et EcoRI dans le gene de resistance a la 

20 tetracycline de YIp5, celui-ci etant prealablement digere par ces deux enzymes. Le 
produit de ligation est introduit dans E. coli. et les transformants resistants & 
Tampicilline et sensibles a la tetracycline sont isoles. Le plasmide est isole comme 
dans le cas de pBNAl a partir de Tun de ces transformants. La structure du 
plasmide recombine obtenu est verifiee par restriction. A titre d'exemple, la 

25 digestion par PstI produit 2 fragments de 4,35 et 3,15 kpb; la double digestion par 
Pstl/Xhol produit 4 fragments de 3,15, 1,8, 1,75 et 0,7 kpb. 

- Vecteur pXXY2 

Le fragment Xhol-Xbal de 545 pb de pKWl (Cf figure 5) est isole et 
insere entre les sites uniques Sall-Nhel dans le gene de resistance a la tetracycline 
30 du plasmide YIp5. Les extremites Xhol et Sail, d'une part, et Xbal et Nhel, d'autre 
part, sont compatibles pour ligation specifique. Le produit de ligation est introduit 
dans E. coli. et le plasmide recombine est isole comme dans le cas de pBNAl. La 
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structure du plasmide obtenu est verifiee par restriction. A titre d'exemple. la 
digestion par EcoRI + Nrul produit deux fragments de 4,5 et 0.96 kpb. 

- Vecteur pXXK3 

Le fragment Xhol-Xbal de 545 pb de pKWl (a figure 5) est isole et 
5 insere entre les sites uniques Sall-Xbal (polylinker au N-terminal de LacZ) du 
plasmide pKan21. Le melange de ligation est introduit dans Rcoli. et les trans- 
formants, etales sur le milieu LB contenant X-gal et UTG, sont isoles comme 
colonies blanches parmi les bleues. Repliquees sur le milieu LB contenant la 
kanamycine, elles croissent bien. Ces colonies sont individuellement analysees pour 
10 leur contenu en plasmide. Le plasmide obtenu a partir de l'un des transfotmants 
presente la structure montree dans la figure 6, verifiee par restriction. A titre 
d'exemple, la digestion par BamHI + PstI produit quatre fragments 2,5, 1,3, 0,55 et 
0,19 kpb. 

- Vecteur pBNBl/A3 

15 Le fragment Bglll-Nhel de 1,9 kpb de pKWl (Cf figure 5) est isole et 

insere entre les sites BamHI-Nhel de YIp5. Le plasmide recombine est isole 
comme dans le cas de pBNAl. La structure du plasmide est verifiee par restriction. 
A titre d'exemple, la digestion par PstI produit 3 fragments de 3,15, 2.8 et 1,36 kpb 
; la double digestion par Pstl/Nhel produit 4 fragments de 3,15, 1,8, 1,36 et 1.0 

20 kpb. 

- Vecteur pNEBl 

Le fragment Nhel-EcoRI de 2,5 kpb de pKWl (Cf figure 5) est isole et 
insere entre les sites Nhel-EcoRI de YIp5. Le plasmide recombine est isole comme 
dans le cas de pBNAl. La structure du plasmide est verifiee par restriction. A titre 
25 d'exemple, la digestion par PstI produit 2 fragments de 4,65 et 3,15 kpb ; la double 
digestion par Pstl/Xhol produit 3 fragments de 3,15, 2,9 et 1.75 kpb. 

3.2. Le deuxieme type de molecules recombinees comient la totalite de la 
sequence de pKWl. Pour obtenir ces vecteurs. pKWl est linealise par coupure 
unique a un site de restriction, permettant d'introduire des segments d'ADN 
30 h6terologue. De tels segments peuvent contenir des genes de structure, inclus par 
exemple dans des cassettes d'expression, et/ou des vecteurs navettes entiers, tels que 
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notammentpKan21 ou YIp5 (figure 4). 

Les exemples de ce type de vecteurs sont pKWCll, pKWSl et pKWS14 
(tableau 2 et figure 7). 

- vecteurpKWS14 

5 L'ADN de pKWl a ete digere par l'enzyme de restriction Sail. Le 

plasmide pKan21, decrit plus haut, est digere aussi par Sail (le site unique Sail est 
localise dans le multisite de clonage present dans le gene LacZ). Les deux plas- 
mides sont ligatures par 1'ADN-Iigase. Le melange de ligation est utilise pour la 
transformation de E. coli J M83 comme dans le cas precedent La suspension des 

10 cellules transformees est etalee sur LB gelose contenant X-gal et IPTG. Les 
colonies blanches, parmi les bleues, sont recuperees individuellement Elles sont 
resistantes a 1'ampicilline et § la kanamycine. Leur contenu en plasmide est analyse 
sur les mini-preparations d'ADN comme precedemment. Le plasmide, pKWSl4, 
isole a panir de Tun des transformants, contient la forme A du plasmide pKWl et 

15 possede la structure montrSe dans la Figure 7. Elle est verifiee par restriction. A 
titre d'exemple, la digestion par BamHI produit 3 fragments de 5,6, 2,6 et 1,2 kpb. 

-VecteurpKWCll 
Le plasmide pKWl est digere par Clal. Le plasmide pKan21 est digerfc par 
Accl. lis sont repurifies par traitement au phenol et precipitation par ethanol. Les 

20 ADN des deux plasmides sont melanges en quantites approximativement egales et 
soumis a la reaction de ligation par l'ADN-ligase pendant une nuit. Le produit de 
ligation est amplifie dans E. coli . Les colonies des transformants sont blanches sur 
le milieu LB contenant Xgal et IPTG. Elles sont resistantes a la kanamycine et 
l'ampicilline sur le milieu contenant Tun ou l'autre de ces antibiotiques. Le 

25 plasmide, pKWCll, isole a partir de Tun des transformants, contient la forme A du 
plasmide pKWl et possede la structure montree dans la Figure 7. Elle est verifiee 
par restriction. A titre d'exemple. la digestion du plasmide par BamHI produit 3 
fragments de 5,6, 2,9 et 0,9 kpb. 

-VecteurpKWSl 

30 Le plasmide pKWl et le plasmide YIp5 sont digeres par Sail. Le melange 

est repurifie et soumis a la reaction de ligation. Le produit de ligation est introduit 
dans E. coli . Des transformants resistants a Tampicilline et sensibles a la 
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tetracycline, sont obtenus. Le plasmide, pKWSl, isote a partir de Fun d'entre eux, 
contient la forme A du plasmide pKWl et poss6de la structure montree dans la 
Figure 7. A titre d'exemple, la digestion du plasmide par EcoRI donne deux frag- 
ments de 8,3 et 2,7 kpb. 

5 4) Construction d'une souche CBS 6430 pKWl ~ 

K.waltii CBS 6430 a d'abord 6te transformee par le plasmide recombinant 
pKWS14 (tableau 2 et figure 7). La methode de transformation utilisee est 
essentiellement celle decrite par Chen et Fukuhara (Gene 69, 181 (1988)) utilisant 
les protoplastes. Les transformants obtenus sont maintenus pendant 75 generations 

10 sur milieu YPD-agar 1 mg/ml G418 (Milieu YPD : extrait de levure 10 g/1 ; 
peptone 20 g/1 ; glucose 20 g/1). lis som ensuite transferes sur milieu YPD liquide 
sans antibiotique et maintenus pendant 10 generations. 

Dans ces conditions (sans pression selective), le plasmide pKWS14 est 
progressivement perdu. Les colonies sensibles a G418 qui apparaissent sont 

15 pr&evees et testees individuellement pour la presence des plasmides. Le test 
consiste en extraction de l'ADN cellulaire, suivie d'une electrophorese de ces ADNs 
sur un gel d'agarose. La pr&ence de plasmides est revelee par coloration au 
bromure d'ethidium. Parmi les colonies qui sont devenues sensibles a G418, 25 % 
se sont rfevelees demunies de tout plasmide. Une de ces colonies a ete gardee 

20 comme souche de K. wahii depourvue de plasmide pKWl et designee KW18. 

5) Transformation de differentes levure 

5.1. Transformation de S.cerevisiae 

Parmi les differents vecteurs decrits dans les tableaux 1 et 2 et aux figures 
4 et 5, certains de ceux contenant le marqueur URA 3 ont et6 utilises pour 
25 transformer une souche auxotrophe ura3 de S.cerevisiae (la souche S150--2B : Mat 
a, uia3, Isfi, irpl, his3, 2|i). 

La m6thode de transformation est essentiellement celle decrite par 
Sherman et al (Yeast Genetics, Cold Spring Harbor, NY, 1986). 

Les rSsultats obtenus sont indiques dans le tableau 3. lis montrent que les 
30 vecteurs de Tinvention sont capables de transformer les levures du genre 

Saccharcwyres- 
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5.2. Transformation de K.waltii 

La transformation de K.waltii a ere realisee avec des vecteurs portant le 
marqueur de resistance a la kanamycine. 

La methode de transformation utilisee est essentiellement celle decrite par 
5 Chen et Fukuhara (Gene £2 (1988) 181) utilisant les protoplastes. II est clair que 
toute autre technique permettant d'introduire un fragment d'ADN dans un 
microorganisme peut etre utilisee. 

Les resultats obtenus sont presentes dans le tableau 4. 

lis montrent que les vecteurs de Invention sont capables de transformer 
10 avec une frequence elevee la levure K.waltii . 

Par ailleurs, l'etude de stabilite decrite dans la figure 8 montre que des 
vecteurs peuvent etre obtenus a partir de pKWl, presentant une stabilite de 100 % 
apres 50 generations de croissance dans un milieu non selectif. Ceci est 
parfaitement illustre par le vecteur pKWCll. Cette etude montre Sgalement qu'il 
15 est preferable, pour obtenir une stabilite relativement 61evee, d'utiliser les vecteurs 
ne comportant que Torigine de replication du plasmide pKWl dans des cellules 
hotes possedant un plasmide pKWl resident. 

5.3. Transformation d'autres levures 

Le vecteur pKWCll, hautement stable et autonome dans K.waltii. a ete 
20 utilise pour tester la transformabilite de differentes especes de levures, et 
notamment celles appartenant au genre Kluweromvces. 
Les resultats sont presentes dans le tableau 5. 

La presence du vecteur pKWCll dans les transformants a ete verifiee par 
electrophorese. 

25 Uensemble de ces resultats montrent que Tetendue des especes hotes des 

vecteurs de Tinvention peut etre tres grande, depassant le genre Kluyveromyces. 

6) Utilisation des vecteurs de invention pour la production de 
PfPtem^S h jterp)pgue<i 

6.1. Interleukine-IB : 

30 6.1.1. Construction d'un vecteur depression et de secretion de TIL-IB 

derive de pKWl (figures 9 et 10). 
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- Le vecteur pXXK3 (tableau 1, figure 6) est linearise par EcoRI et les 
extremites sont comblees avec le fragment Klenow de l'ADN polymerase I de 
Et££li- Un "linker" synthetique (5'-GCGGCCGC-3') formant un site de restriction 
reconnu par 1'enzyme NotI est ajoute au moyen de la ligase T4, et le vecteur ainsi 

5 obtenu (pXKN18) est purifie apres son amplification chez Rcoli (figure 10). 

- Une cassette ^expression de 1'IL-IB est realisee, composee (a) du 
promoteur regule PH05 provenant de S. cerevisiae (Bajwa et al. f NucLAcid.Res. 
iZ (1984) 7721-7739), (b) du gene de 1'IL-IB humaine (Jung et al., Ann. 
Inst. Pasteur/Microbiol. US. (1988) 129-146) precede (c) d'une sequence 

10 synthetique correspondant a la sequence signal de la toxine killer de pGKLl de 
K.lfiCtis (region pre du gene de la sous-unite alpha) (Stark et Boyd, EMBO J. 5, 
(1986) 1995-2002), et (d) du terminateur PH05. La cassette d'expression a 6t§ 
isolee a partir du vecteur pSPH05-IL14 dont la construction est decrite dans le 
brevet EP 361991. La cassette a ete realisee de la rnaniere suivante : A I'extr6mit6 

15 5' du g&ie codant pour la partie mature de TIL- IB est inseree la sequence 
synthetique suivante, sous forme d'un fragment EcoRI : 

MetAsnllePheTyrllePheUuPheLeuLeuSerPheValGinGlyLysArg 
S'-AATTATGAATATATTTTACATATTTTTGTTTTTGCTGTCATTCOTrc 
3•TACTTATATAAAATGTATAAAAACAAAAACGACAGTAAGCA^GT^CCATT^^CT^AA-5 , 

20 Les derniers codons ajoutes (Lys et Arg) forment un site de coupure 

potentiel reconnu par l'endopeptidase Kexl de K.lactis (Tanguy-Rougeau et al ; 
FEBS Lett. 224 (1988) 464). Cette sequence a ete fusionnee au gene de TIL-IB par 
le site EcoRI, formant la jonction suivante : 

Gly Lys Arg He His Met Ala 
25 5\...GGT AAA AGA ATT CAT ATG GCA ....3* 

L*alanine (GCA) correspond au premier acide amine de 1'IL-IB mature. 
Arg-Ile-His-Met correspond a un "linker" EcoRI-Ndel introduit pour faciliter le 
clonage(Cf EP36] 991). 

L'ensemble de la cassette est mis sous forme d'un fragment NotI par 
30 addition d'un linker correspondant (5-GCGGCCGC-3 1 ). 

- La cassette de secretion de 1'IL-IB est inser6e, au site NotI, dans 
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pXKNl8. Le vecteur resultant est appele pXPH05 (figure 10). 

6.1.2. La souche K.waltii CBS 6430 est transformee par le vecteur 
pXPHOS, dans les conditions decrites dans 1'exemple 5.2. 

6.1.3. Expression de TIL-IB: 

5 Les cellules transformees sont cultivees a 28°C, en absence de G418, dans 

le milieu liquide LPi (a faible teneur en phosphate mineral) et le milieu HPi (a 
haute teneur en phosphate), prepares selon Chen et Fukuhara (Gene £2 (1988) 181- 
192), pendant 4 jours. 50 ml de culture sont centrifuges et les surnageants filtres sur 
membrane Millipore (0,22 nm). Les proteines sont precipitees par addition 

10 d'ethanol a la concentration finale de 60 %. Les precipites sont dissous dans 2 ml de 
tampon de Laemmli (Nature 22Z (1970) 680-685) et 20 jil d'&hantillons sont 
utilises pour l'analyse SDS-PAGE selon Laemmli (document precite). Apres 
electrophorese, les prolines sont transferees sur une feuille de nitrocellulose, et 
traitees par un antiserum polyclonal de lapin anti IL-1B humaine. Le Blot est 

15 ensuite traite avec un 2eme anticorps polyclonal anti-lapin biotinylS (Vectastain 
ABC ImmunoPeroxydase Kit, Vector Laboratories). Le complexe antigene- 
anticorps est revele selon le protocole du fournisseur. 

La figure 11 montre qu'une proteine de poids moleculaire apparent de 21 
kDa est secretee par la levure transformee par pXPHOS. La prot&ie est speci- 

20 fiquement reconnue par Tantiserum anti-IL-lB. Cette proteine n'est pas synthetisee 
par la levure transformee par le vecteur de controle pXKN18 (sans cassette IL-1B). 
La proline secretee correspond a la forme glycosyle de TIL-IB, ce qui est 
demontre par la reduction du PM apparent apres traitement par Tenzyme 
endo-N-ac6tylglucosamidase H (figure 11 piste 3). Ce couple hote/vecteur 

25 K.waltii/ pXPHQ5. encore non-optimise, secrete approximativement 5 mg 
d'lL-lBpar litre de culture. Le niveau de la secretion dIL-lB par K.waltii est plus 
eleve dans le milieu LPi que dans le milieu HPi, ce qui suggere que Tactivite du 
promoteur PH05 est r&gulee par le phosphate dans K.waltii comme dans 
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6.2. S&rum-albumine humaine : 

6.2.1. Construction du plasmide pYG140 (figures 12-14). 
Un plasmide a ete construit comprenant: 

- un replicon E.coli . 

5 - le gene aph sous controle du promoteur kl de la toxine killer de K.lactis 

(EP361911) dans lequel le site Hindlll a ete elimine par mutagenSse dirigee, et 

- le g£ne Ma, conferant la resistance & I'ampicilline. 

Le g&ie 2ph sous controle du promoteur kl est isole a partir du plasmide 
pKan707 (EP361991) sous forme d'un fragment PstI, qui est clone dans le site 
10 equivalent du phage M13mp7, Le plasmide resultant est appele pYG64 (figure 12). 
Le site Hindlll present dans ce gene a ete detruit par mutagenese dirigee selon la 
methode decrite par Taylor et al. (Nucl. Acid. Res. H (1985) 8749). Le plasmide 
resultant est appele pYG65. L'oligodeoxynucleotide ayant servi pour la mutagenese 
a la sequence suivante : 5 , -GAAATGCATAAGCT£TTGCCATTCTCACCG-3 , > et 
15 a permis de transformer le triplet CTT codant pour la leucine 185 en CTC. Pour 
construire le plasmide pYG70, la panie contenant le rSplicon bacterien du vecteur 
pKan707 a &e isolee par digestion avec Tenzyme EcoRI et recircularisation avec la 
T4 DNA ligase pour obtenir pYG69. Le fragment PstI present dans ce dernier 
vecteur contenant le gene aph a ensuite' ete remplace par le fragment equivalent 
20 mute provenant de pYG65. Le plasmide resultant est appele pYG70 (figure 13). 

Ce plasmide est ensuite digere par EcoRI et religue en presence d'un 
adaptateur EcoRI-Narl-EcoRI contenant la sequence suivante : 
5 , .AATTCGGCGCCG-3 , . 

La plasmide obtenu est appele pYG140 (figure 14). 

25 6.2.2. Introduction d'une cassette depression de Talbumine (figure 14). 

Le gene codant pour la preproSAH sous controle du promoteur et du 
terminates du gene E£K de S ^visifle a ete isole sous forme d'un fragment Sall- 
SacI a partir du vecteur d'expression pYG19 (EP361991), Ce fragment a 6t$ 
introduit dans les sites conespondant du plasmide pYG140 pour generer le plas- 

30 midepYG141. 
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6.2.3. Construction du vecteur d'expression pYG142 (figure 15). 

Les plasmides pYG141 et pKWl sont digeres respectivement par les 
enzymes Narl et Clal. Apres ligation, 4 plasmides recombinants sont obtenus, en 
raison de 1'existence des 2 formes A et B de pKWl, et de Torientation de la partie 
5 pKWl par rapport a la partie pYG141 . 

La figure 15 decrit la carte de restriction d r un de ces 4 plasmides : 
pYG142, contenant la forme B de pKWl . 

Les autres plasmides sont appeles pYG143, pYG144 et pYG145. 

Un echantillon de la souche K.lactis CBS 6430 a 6te depos§ au CBS i 
10 Baam (Pays-Bas) selon les conditions du Trait6 de Budapest le 4 juin 1991 sous le 
mimero CBS 290.91. 
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TABLEAU 1 



VECTEURS 


Fragment 


VECTEUR 


MARQUEUR 






Ut 1 JV >Y 1 


NAVETTE 




pBNAl 




BgHI-Nhel 


YIp5 


URA3 






2,4 Kb 


* 

Darnni-JMici 




pNEA2 




Nhel-EcoRI 


YIp5 


URA3 






2.0 kb 


Nhel-EcoRI 




pXXY2 




Xhol-Xbal 


YIp5 


URA3 






0,55 kb 


Sall-Nhel 




pXXK3 




Xhol-Xbal 


pKan21 


Kan- 






0.55 kb 


Sall-Xbal 


pBNBl/A3 




BgHII-Nhel 


YIp5 


URA3 






1,9 kb 


BamHI-Nhel 




pNEBl 




Nhel-EcoRI 


YIp5 


URA3 






2,5 kb 


Nhel-EcoRI 




TA3LEAU 2 


VECTEURS 




Site de 


VECTEUR 


MARQUEURS 




LINEARISATION DE 


NAVETTE 








PKWl 






pKWS14 




Sail 


pKan21 *(SalI) 


Kan R 


pKWCll 




Clal 


pKan21 (AccI 


Kan R 


pKWSl 




Sail 


Ylp5 (Sail) 


URA3 
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TABLEAU 3 



Transformation de Saccharomyces cerevisiae par des vecteurs derives de 

pKWl. 



VECTEURS 


Transform ants Ura+ par pg d'ADN 


pKWSl 


4 400 


pBNAl 


1 200 


pBNBl/A3 


7 600 


pXXY2 


4 000 


pSKl 


4 500 



TABLEAU 4 

Transformation de Kluyveromvces waltii par des vecteurs derives de pKWl. 



VECTEURS 


Support de 


• Transformants G418-resistants 




replication 


parpg 


d'ADN 






pKWl + 


pKWl* 


pKWCll 


pKWl total 


36 000 


8 000 






(98%) 


(100 % 


pXXK3 


Xbal-Xhol 


35 000 


10 000 




540bpdepKWl 


(49 %) 


(2.8 %) 


pKWS]4 


pKWl total 


10 000 


8 000 






(92 %) 


(29%) 
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TABLEAU 5 



Transformation de levures du genre Kluyveromyces . 
avec le veaeur pKWCl 1 









Frequence de 


Stabilite des 


Espece 


Souche 


GC% 


transformation 


transformants 








par |ig d'ADN 


(%) 


K.waltii 


CBS6430 


45,6 


2400 


100 


K.thermotolerans 


CBS6340 


46,2 


4000 


25 
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IREVEhfpiCATIQN? 

1 - Plasmide pKWl isole a partir de la souche K.waltii CBS6430, on tout 
fragment ou derive de celui-ci. 

2 - Fragment selon la revendication 1 caract6ris6 en ce qu'il s'agit d'un 
5 element genetique. 

3 - Plasmide caracterise en ce qu'il comprend tout ou partie de la sequence 
presentee a la figure 3 ou d'un derive de celle-ci. 

4 - Vecteur de clonage et/ou d'expression caracterise en ce qu'il comprend 
tout ou partie du plasmide pKWl de K.waltii CBS 6430 represents a la figure 1 ou 

10 d'un derive de celui-ci. 

5 - Vecteur selon la revendication 4 caracterise en ce qu'il comprend un 
element genetique au moins du plasmide pKWl. 

6 - Vecteur selon la revendication 5 caracterise en ce qu'il comprend 
l'origine de replication du plasmide pKWl . 

15 7 - Vecteur selon la revendication 4 caracterise en ce qu'il comprend 

1'integralite du plasmide pKWl . 

8 - Vecteur selon la revendication 4 caracterise en ce qu'il comprend tout 
ou partie de la sequence presentee a la figure 3 ou d'un derive de celle-ci. 

9 - Vecteur selon Tune des revendications 4, 7 ou 8 caracterise en ce que le 
20 plasmide pKWl est linearise au niveau d'un site de restriction fonctionellement 

neutre. 

10 - Vecteur selon la revendication 9 caract6ris6 en ce qu'il s'agit d'un site 
de restriction present sur le plasmide pKWl, ou introduit artificiellement sur 
celui-ci. 

25 11 - Vecteur selon la revendication 1 0 caracterise en ce qu'il s'agit d'un site 

de restriction introduit artificiellement dans une region intergenique. et de 



25 



preference dans la region situee entre les genes B et D ou dans la region situee entre 
le g&ne D et l'IR2. 

12 - Vecteur selon la revendication 10 caracterise en ce que le plasmide 
pKWl est linearise au niveau des sites Clal(l), Pstl(4608) ou EcoRV(3072), les 
positions etant donnees par rapport a la figure 3. 

13 - Vecteur selon l'une quelconque des revendications 4 a 12 caracterise 
en ce qu'il contient en outre une sequence d'ADN heterologue comprenant un gene 
de structure au moins sous le controle de signaux pennettant son expression. 

14 - Vecteur selon la revendication 13 caracterise en ce que les signaux 
d ! expression sont constitues par un ou plusieurs elements choisis parmi les 
promoteurs. les tenminateurs, et les signaux de secretion. 

15 - Vecteur selon la revendication 14 caracterise en ce que les promoteurs 
sont regulables. 

16 - Vecteur selon la revendication 14 caracterise en ce que les promoteurs 
derivent de gdnes de levure, et preferentiellement de genes glycolytiques de levure. 

17 - Vecteur selon la revendication 13 caract6ris6 en ce que le gene de 
structure code pour un polypeptide d'interet pharmaceutique ou agroalimentaire. 

18 - Vecteur selon la revendication 13 caracterise en ce que le gene de 
structure code pour une proteine hybride. 

19 - Vecteur selon la revendication 13 caracterise en ce que le ou les genes 
de structure sont des genes intervenant, au niveau genetique ou biochimique, dans 
la biosynthese d'un metabolite. 

20 - Vecteur selon la revendication 4 caracterise en ce qu41 contient en 
outre un replicon E.coIk 

21 - Vecteur selon la revendication 4 caracterise en ce qu'il contient en 
outre un marqueur de selection au moins. 



WO 93/00437 



26 



PCT/FR92/00559 



22 - Cellule recombinee contenant un vecteur selon Tune quelconque des 
revendications 4 a 21. 

23 - Cellule selon la revendication 22 caracterisee en ce qu'il s'agit d'une 

levure. 

5 24 - Cellule selon la revendication 23 caracterisee en ce qu'il s'agit d'une 

levure du genre Kluweromvces ou Sacch^rpmyces. 

25 - Precede de preparation d'un polypeptide caractferise en ce que Ton 
cultive une cellule recombinee selon Tune des revendications 22 a 24 et on r§cupere 
le polypeptide produit. 

10 26 - Precede selon la revendication 25 caracterise en ce que le polypeptide 

est choisi parmi les enzymes (telles que notamment la superoxide dismutase, la 
catalase, les amylases, les lipases, les amidases, la chymosine etc.), les derives 
sanguins dels que la serum-albumine, 1'alpha- ou la beta-globine, le facteur VIII, le 
facteur IX, le facteur van Willebrand, la fibronectine, l'alpha-1 antitrypsine etc.), 

15 Tinsuline et ses variants, les lymphokines [telles que les interleukines. les 
interferons, les facteurs de stimulation des colonies (G-CSF, GM-CSF, M-CSF...), 
le TNF, le TRF etc.], les facteurs de croissance (tels que l'hormone de croissance, 
Terythropoietine, le FGF, l'EGF. le PDGF. le TGF etc.), les apoiipoproteines. ou 
encore des polypeptides antigeniques pour la realisation de vaccins (hepatite, 

20 cytomegalovirus, Eppstein-Barr, herpes etc.). 

27 - Procede selon la revendication 26 caracterise en ce que le polypeptide 
est ralbumine humaine ou un de ses variants ou precurseurs. 

28 - Utilisation d'une cellule recombin6e selon l*une des revendications 22 
a 24 comme catalyseur dans une reaction de bioconversion. 




Oal(i) 

XhoI078) 

Sall(444) 




EcoRV(697) 



BamHI(3892) 



Pstl<3638) 

Xbal(3443) 



Sacl(1772) 
Nhel(l855) 



EcoRV(3072) 

Xhol(2898) 



BamHI(2200) 
Xhol(2230) 
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I 10 I 20 40 | 50 | 60 

1 ATCGATTGCC AGCAACAGGG TTTTGCGCGT ATGTCTCTTG TGGATACTAT GTAAACAAAA 60 
61 CAATCAATGT ACAAAGAGCA CAGCGGCCGG CAGGTGGGAG GACCCTCTGA TGAGCCGGGG 120 
121 ATATGGCGCT CCCGCGCGTC IAATATCCGG ATTGGACTGG AGGAGGACCA AGGTTTCCTC 180 
181 GAGGTCATGT GCCGCATCAT GAGGGACGAA AAATGGTAAG GAATAGACCA TTCCTTACCA 240 
241 TTTTTCGTCG CCCGTGAGAT TTTCCCATTT CCCGTTCCTT ACCATTTTTC GTTCCGCACG 300 
301 ACCCTATCAC ATTGTATATT GAAATCTACT TCCCTTCATA CCGCTTGGCC ATCGCGTAGG 360 
361 AATGAACATA TGTAGCCCCT CTAGTTCCTC ATGTTGTTCT CAATCGACCC TTCCATCGTG 420 
421 AAGGGATCTC CTCTTGAGGC AATGTCGACG TTCGTACCCT CTTCCTACGG GTCACGGGTT 480 
481 CGTCTGTAAC ACTTCTTCTT GGTCTCCCTC GGCCTCTTTT ACTTGGCTGT GGCCTGGTAT 540 
541 TTTTGAGTTC ATCGAATAGG CGCGGGTTTT CTTTTACTTG AGGCCAGTCT TGAATCTCTG 600 
601 AACCGAGAGA GGTTAGA6AA GTTATTCTTT TTAGATCATT TAACATGTCC TTGATGTCTT 660 
661 CTGGCGTTGT TTCGAAGCAC ATCAGTCGCC TTGAGCGATA TCTGTCGTAA TTTGCCAGTA 720 
721 TTACGTTGTG CGCTTCTTCC ATGTTTTCAG GGGCCACATG CTTTAATGCC TGCACTAAAA 780 
781 CACTTCTGAC AAGTGACCAA TCTGCGAATG CAGGCTCGTT CGCCAATATC AATCTCTGTA 840 
841 GAGGAACACC ACGATAGCTT GTTGTGCCCT TGCAGATAGT GTTCAAGAAT AGACTGAGGT 900 
901 AGCCACGTAC GTCGAGCTTT ACAGACCTGG TGCCAACGCC AGAAAGAAGG GCGAAGGGGT 960 
961 CCTCTTCAAT CGGAAAACGG GTCAGGCTAT CCACACGGTA CTCTCTATAT GTACTACGAG 1020 
1021 TCATCGTCGT GTACTTTGCG AAGTGCAGGC CGTGGCGATT ATAGTCAATC TGGAAAGAAT 1080 
1081 CCTGCTCATG TGGCTCTTTC TCCCCATTAT CCTCTTCAGA GTTCAGCGAG CCAGATGGCA 1140 
1141 GCTCGGCTGG CTCTCGCAGG TACGTGGGAT CGGGCTCACC TCGATCCACC GTCATCTCAT 1200 
1201 CAAGATTGCA CATAATCTGC ATCAGTCTCA ACGTCATATC GACCGCGGAA AAGGCGTCCG 1260 
1261 AGTAGGAAAC ATGCAGTTTG GAAAGGTCTA ACAGCTTGAG GCAGTGCATC TrGGCCTCTC 1320 
1321 TCTCTGTCAG TCTTTCTCTG TTTTGACCAA TTTTTCTCAA GTGTATTACA TTTGTTTCTT 1380 
1381 GGATTGCAAA AATGTTGCGA GTACTGCGTG TTCTCGTTCA AAAACAGCGT TCGCTGAAAA 1440 
1441 TTTAGGAGTT CAGATGCAAC GCGTAGTGCA AATGGAGGAT TCAAGTTGCA GTAACAATAA 1500 
1501 CATGGAACAC CAAG6ATCAG TGTTCGAGGA GCTTATCTCC AAAAATCTTA TGAGCCTGAT 1560 
1561 GGAAGAATTG ATGTCTATGC TCACTAATGA GAAG6AGTTC CAACGTGAAA GGTTCGCGTC 1620 
1621 TCTCCTAGCC TACATGATAA TGGCTACTGG TGAATTGGAA GAGAAAAAGC TCAGTACATT 1680 
1681 TACCAAGTAT TCCCGACGGA TCAGGCAGAC GGTAGAGTTC GACAGCAACA ACCAAATCGT 1740 
1741 AAGATTTGAG TACCATTTGA AGAATCCCAC AGAGCTCAAG GAGACGCTGG ACAAGGCCTT 1800 
1801 TAAACCTGTC GTGTTTGAAA TCAAGTCCAA AAAGAAGGTT GTCTCCATGC TGGAGCTAGC 1860 
1861 TGCGAAGCTC GACAAAAGGG GATCA6ATTC AGCGGGTGGT ACGGTAGCTA GTGAGGTCTC 1920 
1921 GAAGCTTGTG CGGGAGGAAG AAATTTGGCT TCTTCTCGTG AACGTGAAGA ATACTATCCA 1980 
1981 GGAAAAGGTG CGCAAATCAT CGCTAAGAGC GGAATTGACG TATATTTTGA CAGCCTCATT 2040 
2041 CTTCAATTGT TGCAGACATA GCGATCTCAG GAACGCAGAC CCCGCAACAT TTGAGCTGGT 2100 
2101 GCCAAATAAG TATGTGGGCC ACGTTGTCCG GGTTTTGGTG TGCGAGACCA AGACCCGAAA 2160 
2161 GCCGCGGTTC ATATACTTTT TCCCTGTCAA TACGGCCGCG GATCCTCTAG TAGCGCTTCA 2220 
2221 TGATTTGTTC TCGAGCACGT TTCCTTCCAA AAAGAGTCGG ACGTCCGAAA GAAAGCAGGA 2280 
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2281 ACAGGAATGG CAGATCGTTC GCGACGCATC^AATCAACAAC TATGACCGGT TTGTTGGTAA 2340 
2341 GCACGCTACG GAATCTGTCT TTGCCATCTT GCATGGTCCC AAATCACACT TGGGCCGGCA 2400 
2401 CTTGATGAGT TCCTACTTGG CGTATACCCA CCATGGGGAA TGGGTCTCAC CATATGGGAA 2460 
2461 TTGGTCAGCT GGGAAAGGAA CCATTGAAAG CAGCGTGGCA AGGGCCAAGT ACGCACATGT 2520 
2521 TCAAGCCGAG AICCCAAGCG ATCTTTTCGC CTTTCTGTCT CAGTACTATC AGGAATCAAA 2580 
2581 ATCGGGCGAT TTCGAGCTTA ACGACACCAG CAAAGACCCA ACAAAGCTGG TACGGCACTC 2640 
2641 GGCTAGTCAA CTGGAAATCA ATCGAACCTA TGGTCCATGG AGTAGATTGG TTAACAAGGA 2700 
2701 TGTTTTAGGC TTTGTTCATT CCTACGCGAT GGCCAAGCGG TATGAAGGGA AGTAGATTTC 2760 
2761 AATATACAAT GTGATAGGGT CGTGCGGAAC GAAAAATGGT AAGGAACGGG AAATGGGAAA 2820 
2821 ATCTCACGGG CGACGAAAAA TGGTAAGGAA TGGTCTATTC CTTACCATTT TTCGTCCCTC 2880 
2881 ATGATGCGGC ACATGACCTC GAGGAAACCT TGGTCCTCCT CCAGTCCAAT CCGGATATTA 2940 
2941 GACGCGCGGG AGCAGCCTAT CCCCGGCTCA TCAGAGGGTC CTCCCACCTG CCGGCCGCTG 3000 
3001 TGCTCTTTGT ACATTGATTG TTTTGTTTTA GTATTACCTG ACAATCATTT TATATTTTGT 3060 
3061 CAGTATTTCT TGATATCTGG CCCAAATGAA AGTACAAATA CAAGTACAAG TACAACACCT 3120 
3121 ATTCATTGTT ACCGTATCTC TATACTATTA TCCTTATTTC CTGCCTAATT AACTACTTTC 3180 
3181 TACCGGTGCG TTCTTAAAGC TGAGTAGGCA CTTCAGCCCG AAGTGAATAT CGCTGGCCTC 3240 
3241 ATTATCTGTT TGTTGTATGG CCAATGAAAC TCCAACCGAT TTGATCCACT TGCAAGGACC 3300 
3301 GTAGGATAGA CTTATTTTTA CCATCCCATT ATCTGTGCAG TGGACACCTC TGTTTATCTT 3360 
3361 TACCCGCCCT TCAGAGAACA TAATCTGTCT TACAAAAGAG TAGACCTCAT TTTTGGCGAG 3420 
3421 AAGCCTCTTC TGTTTGACCT CATCTAGAAG CTTTTGGGCT CTCCCAGCGC AATCAGATAG 3480 
3481 TCTTGTGAGA GTGTCCTCTT CGTCACCATG CTCATCAGAA GGAGCTGGTT GCGTTCCAAT 3540 
3541 TGAGAAAGCT CGTCCCAAAA GGCTGCATGG TCTATAGGTG GTCCCGAACC CGAGGATTCA 3600 
3601 CCTTGAGACT CATTGTCCAC AGTAGGCTCC TGATCCTCTG CAGCAGCCGC TTGCTGAATG 3660 
3661 GATTCTGCTC TTGACATTAC CATTTCGAGA AGCCATAGTC TTCGGATGGT TCTAGCAGAT 3720 
3721 CTTTCAACAT CCAAACTGGA ACCGAACCAT TGCCGACAAC TTATTCTAAC CTCAAGCTTT 3780 
3781 GAGAGGTTCT CATACTTGGA TTGTGCAGCC TCAAGATCCG TAAGTTCGGT GAAGAAATCT 3840 
3841 AAAGCTTCGC GTTTTGGACC TAACCGAATG ATGATTGGGT GCCGTTTTCG TGGATCCAGA 3900 
3901 AATGGTGTAA GCTCCTCTAT ACTATCATTC GTGGGACACT CTATCCCTTC CCCAATATGC 3960 
3961 TTCTTTACAA TAGAAGGTAG CTGCGTATAC TTGTTCCGAA CAACAAAGAT GTGACTCTCT 4020 
4021 AGCCGCTTTA CTATTGTGTT CAACACAACG TAGGGTTTTG GCCACTCAAA TGTTAATTCT 4080 
4081 GATCGAGGTG CTGATGCTGT GTTCTTGTTG ATCATGTATG AATAGTAGAA CAATGCCAAT 4140 
4141 TGAGGATGCT CACTGTATTC CTTAGGCAGT TTGGTGCTGC CATAAGGTGA CACCAGCTCC 4200 
4201 TTTAGCTGTG GAACATAGAG TACATCAACA GTTCCTACTA GACAACATTC CTTGAGACAA 4260 
4261 TTATGATAGC CATCATGGTC GGTTATCTTA GGTATTTTTT GAGCTTCACT CATCTTCGAA 4320 
4321 GCAACCGTGA TAGATTCGAT TGAAGTTCAA ATTCTTATCT AGATGGTGTA TTTGTTTATC 4380 
4381 ATAATTTACA ATACAGTCTG TTTTAATTTG CTCGAAGTTG CAGTGAAAGA TGTAAAAAGG 4440 
4441 GGCTTCATTT TGCACTACAG ACTTACCCTG ATGTAAAAAA TTTTCATCAT AAAAGCAATT 4500 
4501 TCTCGTATAC AAAATGCAGT TTGTTTCGIA TACAGCAAAG CATAGAATAC ACTGTACACT 4560 
4561 GCATTTTTAC TACAAGAAAA GTTTTTTTTG CTGCTGTGAC TGGAATGCTG CAGCJVGTACC 4«20 
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4621 TAGATAGAAA AATGGCATAA AACTGAAATT TTATA6TCAT TTTTC6TGTC TTTCATTCAA 4680 
4681 TTTTTTCTCG CAAAAGTTTT CTACAAAAGC AGTCAAAATT GCAATAAGTA TACACTAATT 4740 
4741 ACAAGGCGTC TGAGCGCGTG ACTTGAGCGC GTGACGTAAT CGCGAGCTAC GAAAGTTGTT 4800 
4801 TGGGCCTCAG ACATCGGATC GACAGAAGAG GTAAGAATAT TGGGAAAGTA CATTCAATTA 4860 
4861 CCACAACAAT CGAGAGATTA GTGGAATTCA GTCATTAATG AAAGGTAGGG TAGTCCGCCT 4920 
4921 ACTCTTAGTT CTACATTCAG AATACGCATG CAGTCCTCAA GTTCTGATGA AGACGACCTA 4980 
4981 ATTGACCCTA TAATTCATCC CAAATCGTTC TATAGGGCGG CTAACGAGAT ACCGAGAGAC 5040 
5041 TTTTTGGTTG CGATCCCCAT CAGCGCCTAT GTTTTTAGCG TATTTGCTAA ATCAGTACGA 5100 
5101 GATGACTTAC AGGGGCATTT AACGGCGCGA GATATGGCAT TAGCTTATCG TGAACGGCAG 5160 
5161 TACTTTCACA GACGCTGGGA GACACGAAAC GACCAGCTTG AGATCCCAGA CTGGTCTGAG 5220 
5221 ATCCCAGAAT GGTCTCTCGG GTTACTGGAT CGCCCTCCTT GTATCACTGT GGATCTAGCA 5280 
5281 AGAGAACTGC GC6AACTATC TCAAAAATGG ATCGGAGCAT TCGATCTGGG ATCGAAGATG 534 0 
5341 TCTGGCAGGC TTCTTCTACA GCTTCTGTAC ACCCAGCTGT CATGCCCAAA TGAGGCTGTT 5400 
5401 TTCAATAAGC TTTACTGCCT CGTCAAACTA CTAAACAAGG ACGTAAATCG TGCGGACCGA 5460 
5461 GCCCTTATGG ACTCTGTATT GAGACCACTT TTTGTCGAGA ATCCATACAT GGGTGAACTA 5520 
5521 GATGAAGAAA TACTTGATAA GATATGGTCC AATTTGACTG AAATGAGAAG TCAAGAGTGG 5580 
5581 AAACGTATAG CGGAAGCGTT GTCAGGCGAG AATAATGAC 

561 9 
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The present invention concerns a new yeast plasmid, as well as new cloning and/or 
expression vectors derived therefrom, their preparation and their use, notably for the production 
of recombinant proteins. The invention also concerns recombinant host cells containing such 
vectors. 

More specifically, the present invention concerns all or part of a new plasmid isolated 
from the yeast Kluyveromyces waltii or a derivative thereof, and the cloning and/or expression 
vectors constructed from it. 

During the past ten years, yeasts have become very promising host microorganisms for 
the production of heterologous proteins. 

In particular, the identification by Beggs et al. (Nature 275 (1978) 104) of the plasmid 2*i 
and vectors derived therefrom was one of the keys of the current development of the genetic and 
molecular study of the yeast Saccharomyces cerevisiae. Since that time, the 2\i system has 
allowed the introduction and the expression of heterologous genes in yeast to obtain proteins of 
pharmaceutical or agro food interest. However, plasmid 2\i and its derivatives can replicate 
effectively only in yeasts belonging to the species S. cerevisiae and to some related species. 
Therefore, this system cannot be used for genetic manipulation in most yeast species. Notably, it 
cannot be used in yeasts whose physiological properties, which are different from those of 5. 
cerevisiae, would allow better-performing new applications and/or industrial uses. 

Different laboratories therefore have sought other plasmids in different yeast species. 
Thus, several circular plasmids have been found in the yeasts of the genus Zygosaccharomyces, 
and notably the plasmids pSRl and pSR2 (Toh-6 et al., J. Bacteriol. 151 (1982) 1380); pSBl, 
pSB2, pSB3 and pSB4 (Toh-e et al., J. Gen. Microbiol. 130 (1984) 2527); and pSMl (Utatsu 
et al , J. Bacteriol. 169 (1987) 5537). A circular plasmid has also been found in Kluyveromyces 
drosophilarum: pKDl (Falcone et al., Plasmid 15 (1986) 248). 

All these plasmids present characteristics which they share with plasmid 2\i 9 notably 
inverted repeat sequences, and the existence of two possible isomeric forms due to a site-specific 
recombination site. 

However, these plasmids always present the drawback of having a narrow host spectrum. 
Thus, because of their specificity with respect to yeast hosts, these plasmids can only be used in 
a limited number of strains. 

The present invention is the result of the identification of a natural plasmid of the yeast 
Kluyveromyces waltii. This plasmid, called pKWl , is the first known natural plasmid of this 
yeast species. The plasmid has been purified from the strain K waltii CBS 6430, and it has been 
mapped using restriction enzymes; the resulting map is presented in Figure 1 . 

An object of the invention thus consists of the plasmid pKWl isolated from the strain K 
waltii CBS 6430, or any fragment or derivative thereof. 



5 



In the meaning of the invention, the term derivative denotes plasmids which, in spite of 
some modifications, preserve the properties of the original plasmid. Notably, the modifications 
can take on the form of mutations or deletions concerning regions having a relatively large size. 
They can also be insertions or suppressions, for example, of cloning sites. 

The term pKWl fragment notably denotes the different genetic elements of this plasmid. 
It is more advantageous to notably mention, as genetic elements of pKWl, the structural genes or 
parts thereof, functional promoter sequences, inverted repeat sequences, or sequences (IR) that 
allow replication (replication origin) or confer stability to the plasmid (stability locus). 

Indeed, the structural study of plasmid pKWl has allowed the detection of analogies with 
the plasmid 2\i of S. cerevisiae. Thus, 4 structural genes have been identified (see Figure 2), as 
well as a replication origin. Moreover, the cloning of pKWl in E. coli has allowed the isolation 
of 4 types of recombinant plasmids, corresponding to 2 isomeric forms of plasmid pKWl 
(forms A and B) cloned in the vector pKan21 in the two possible orientations (vector pKan21 is 
described in Example 3.1). These two forms are presented in Figure 1 . The existence of two 
isomeric forms indicates the presence of inverted repeat sequences. The study has thus shown 
that plasmid pKWl contains a pair of inverted repeat sequences each having a length of 0.3 kb, 
and two unique sequences of 2.5 and 2.3 kb, whose orientation distinguishes the two isomeric 
forms A and B. The molecular size of plasmid pKWl is thus approximately 5.5 kb. Different 
restriction sites have been detected, for example, the following sites: EcoRI, SphI, Sail, Clal, 
Nhel and BglL 

The complete nucleotide sequence of plasmid pKWl has also been determined (Figure 
3). The absence of homology between this sequence and that of known plasmids has been 
demonstrated, notably by hybridization experiments (see Example 2). The absence of 
hybridization under conditions of moderate stringency is characteristic of this difference in 
sequence. 

In a preferred embodiment, the invention relates to a plasmid comprising all or part of the 
sequence presented in Figure 3 or a derivative thereof. 

Moreover, the applicant has also shown that it is possible to use plasmid pKWl or 
fragments thereof to construct particularly stable cloning and/or expression vectors. 

Another object of the present invention thus consists of cloning and/or expression vectors 
characterized in that they comprise all or part of plasmid pKWl of JL waltii CBS 6430 
represented in Figure 1 , or a derivative thereof. 

A more specific object of the invention consists of a cloning and/or expression vector 
characterized in that it comprises at least one genetic element of plasmid pKWl . 

Because of the host spectrum of plasmid pKWl, the vectors of the invention can be used 
in species other than the natural host K waltii. 
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They can notably be used for the transformation of a large variety of species, notably 
yeast species. 

Different types of vectors have been constructed from pKWl ; they differ at the level of 
the size of the fragment originating from pKWl and thus of the functional elements originating 
from pKWl. 

An even more specific object of the invention consists of a cloning and/or expression 
vector characterized in that it comprises the replication origin of plasmid pKWl . 

Other constructions can be prepared, containing fragments of varying sizes, to study the 
influence of the different elements of pKWl on the stability of the vectors, their host specificity, 
and their effectiveness for the expression of the heterologous genes. In particular, expression 
vectors can be elaborated from the different genetic elements of plasmid pKWl (replication 
origin, inverted repeat sequences, structural genes, promoter regions...), which one can introduce 
into known plasmids to improve their performances or to confer novel properties to them. In the 
same manner, vectors can be obtained by adding elements to plasmid pKWl , or by replacing 
certain genetic elements of pKWl with elements originating from other plasmids. Thus, vectors 
can be obtained by substituting, for example, the replication origin of pKWl with the replication 
origin of the plasmid 2\i of S. cerevisiae or of the plasmid pKDl of Kluyveromyces, or by a 
chromosomal replicon (ARS) of yeast (example: KARS of K. lactis). In the same manner, 
vectors can be obtained by substituting the stability locus of pKWl with that of plasmid 2\i of S. 
cerevisiae or plasmid pKDl of Kluyveromyces. It can be particularly advantageous to prepare 
hybrid vectors which comprise plasmids pKDl and pKWl . 

Advantageously, the vectors of the invention comprise the entire plasmid pKWl as 
represented in Figure 1 . 

It is preferred for the vectors according to the invention to comprise plasmid pKWl , 
linearized at a functionally neutral restriction site. 

The term functionally neutral restriction site, in the meaning of the present invention, 
denotes a restriction site at whose level it is possible to interrupt the structure of the plasmid 
without altering its replication and stability properties. 

In particular, the sites can be sites which are present on plasmid pKWl . As an example, 
one can notably mention the sites Clal(l); Pstl(4608); or EcoRV(3072) as represented in 
Figure 1. 

The sites can also have been artificially introduced into plasmid pKWl , or rendered 
unique. In this case, the sites are preferably introduced in intergenic regions of the plasmid, and 
notably in the region located between the genes B and D, or in the region located between gene 
Dand ER2. 



7 



Advantageously, according to the present invention, plasmid pKWl is linearized at the 
level of a unique restriction site. 

A particularly interesting site in this regard is the unique Clal site located in position 1 in 
Figure 1 . Indeed, the applicant has shown that this site allowed the use of plasmid pKWl to 
construct the cloning and/or expression vectors, by introducing at this level, for example, 
heterologous DNA fragments, while maintaining the stable replication of the vector obtained. 
This result is surprising to the extent that site Clal is located in structural gene B. 

The use of such neutral cloning sites thus allows the obtention of very stable vectors 
which are capable of staying in the transformed cells, even in the absence of any selective 
pressure. 

Advantageously, the vectors of the invention contain, in addition, a heterologous DNA 
sequence comprising at least one structural gene, under the control of signals allowing its 
expression. 

The signals allowing the expression of the structural gene(s) can consist of one or more 
elements chosen from promoters, terminators or secretion signals. It is understood that the 
signals are chosen as a function of the used host, the structural gene and the desired result. In 
particular, it can be preferable in some cases to use a promoter which can be regulated, allowing 
the decoupling between the growth phases of the hosts and the phase of expression of said 
structural gene(s). Similarly, the use of the peptide signal (secretion signal) can make it possible 
to increase the production rate of the desired protein and facilitate the purification step. 

It is preferred for the promoters used to be derivatives of yeast genes. Promoters of 
particular interests are those derived from glycolytic genes of yeasts of the genus Saccharomyces 
or Kluyveromyces. Notably, one can cite the promoters of genes coding for phosphoglycerate 
kinase of 5. cerevisiae (PGK), glyceraldehyde-3-phosphate dehydrogenase (GPD), enolases 
(ENO), alcohol dehydrogenases (ADH). One can also cite promoters derived from strongly 
expressed genes, such as the lactase gene (LAC4) or the acid phosphatase gene (PH05). 

Moreover, these genes can be modified by mutagenesis, for example, to add additional 
transcription control elements, such as, notably, UAS ("Upstream Activating Sequence") regions. 

The structural gene which can be introduced into the vectors of the invention preferably 
codes for a polypeptide of pharmaceutical or agro food interest. For example, one can mention 
enzymes, such as, notably, superoxide dismutase, catalase, amylases, lipases, amidases, 
chymosine, etc.), blood derivatives (such as serum albumin, alpha- or beta-globin, factor VIII, 
factor EX, van Willebrand factor, fibronectin, alpha-1 antitrypsin, etc.), insulin and its variants, 
lymphokines (such as interleukines, interferons, colony stimulation factors (G-CSF, GM-CSF, 
M-CSF...), TNF, TRF, etc.), growth factors (such as growth hormone, erythropoietin, FGF, 
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EGF, PDGF, TGF, etc.), apolipoproteins, or antigenic polypeptides for the manufacture of 
vaccines (hepatitis, cytomegalovirus, Epstein-Barr, herpes, etc.). 

In a special embodiment of the invention, the structural gene can be a gene resulting from 
the fusion of several DNA sequences. The gene can notably be a gene coding for a hybrid 
polypeptide containing an active part associated with the stabilizing part. As an example, one can 
mention the fusion between albumin or albumin fragments and a receptor part of a virus receptor 
(CD4, etc.). 

In another embodiment, the heterologous DNA sequence can comprise several structural 
genes, notably genes involved, at the genetic or biochemical level, in the biosynthesis of a 
metabolite. The metabolite can be, in particular, an antibiotic, an amino acid or a vitamin. 

In a special embodiment, the vectors of the invention contain, in addition: 

- an E. coli replicon and/or 

- at least one selection marker. 

These elements allow the manipulation of the vectors of the invention in a much easier 
manner. 

Another object of the invention concerns recombinant cells containing a vector as defined 

above. 

The recombinant cells are preferably chosen from yeasts. 

The applicant has shown that the vectors of the invention can indeed be used either in K. 
waltii (the natural host of pKWl) or in yeasts of different species or even different genera. 
Notably, they can be used in other Kluyveromyces species or in Saccharomyces. Moreover, when 
strain K. waltii CBS 6430 is used as the host cell, homologous recombinations between the 
vectors of the invention and the resident plasmid pKWl can affect the stability of the vectors, 
and thus decrease the performances of the host/vector pair. To further improve the stability of the 
vectors of the invention in such a host/vector pair, the applicant has prepared a strain K. waltii 
pKWl' (KW1 8). This strain allows the optimization of the industrial use of the vectors of the 
invention (see Example 4). 

Different techniques can be used to introduce the vectors of the invention into the host 
cells. In particular, transformation (Bianchi et al., Curr. Genet. 12 (1978) 185) and 
electroporation (Delorme, Appl. Environ. Microbiol. 155 (1989) 2242) yield good results. 
However, it is clear that the invention is not limited to a particular technique. 

An object of the invention also consists of a method for the preparation of a polypeptide 
according to which a recombinant cell as defined above can be cultured and the produced 
polypeptide recovered. More specifically, the method of the invention allows the production of 
proteins of pharmaceutical or agro food interest, such as those indicated above. More 
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specifically, the method of the invention can be adapted to the production of human albumin and 
of its variants or precursors. 

In the case where the structural genes are involved in the biosynthesis of a metabolite, the 
recombinant cells can also be used directly in a bioconversion process. 

Other advantages of the invention will become apparent after a reading of the following 
examples which must be considered to be illustrative and nonlimiting. 

Legend of the figures 

Figure 1 : Restriction map of plasmid pKWl . The inverted repeat sequences as well as the 
structural genes A-D are indicated. The positions indicated for the restriction sites correspond to 
the first nucleotide recognized by the enzyme. 

Figure 2: Study of the open frames of plasmid pKWl. The genetic elements indicated are 
localized at the following positions with reference to the sequence presented in Figure 3 : Gene 
A: nucleotides 1454-2755; gene B: nucleotides 4948-54; gene C: nucleotides 389-1309 on the 
complementary strand; gene D: nucleotides 3444-4313 on the complementary strand; IR1: 
nucleotides 53-368; IR2: nucleotides 2713-3028. 

Figure 3: Nucleotide sequence of plasmid pKWl. The sequence represented corresponds 
to the B form of the plasmid. Position 1 corresponds to the first nucleotide of the sequence 
recognized by the enzyme CM. Plasmid pKWl was fragmented by restriction enzymes, and the 
fragments were cloned in pTZ18R (Pharmacia). The sequences of the cloned segments were 
determined using the 2-strand Sanger method. 

Figure 4: Restriction maps of the shuttle plasmids YIP5 and pKan21. Ap: ampicillin 
resistance gene; Tc: tetracycline resistance gene; Km: kanamycin resistance gene (G418); LacZ: 
structural gene of p-galactosidase. 

Figure 5: Strategy of construction of the vectors pBNAl, pNEA2, pBNBl/A3, pNEBl, 
pXXY2 and pXXK3. See also Table 1. 

Figure 6: Restriction map of the vector pXXK3. 

Figure 7: Strategy of construction of the vectors pKWCl 1, pKWSl and pKWS14. 

Figure 8: Study of the stability of vectors pKWCl 1 and pXXK3 in the strain K. waltii 
KW18. In each case, a transformed clone was cultured in nonselective YPG medium for the 
indicated number of generations, and then aliquots of the culture were plated on YPG agar Petri 
dishes with and without G418, to determine the total number of cells and the number of cells 
resistant to G41 8. The stability corresponds to the % of resistant cells. 

Figure 9: Strategy of construction of the expression vector pXPH05. Abbreviations: P = 
promoter, T = terminator, ss = secretion signal, CIP = Calf Intestinal Phosphatase, Km = 
kanamycin, E = EcoRI, H = Hindlll, S = Sail, B = BamHI, Sm = Smal. 
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Figure 10: Restriction maps of the vectors pXKNl 8 and pXPHOS. Legend: see Figure 9. 

Figure 1 1 : Immunological detection of IL1 p produced by K. waltiL The molecular weight 
markers (KDa) are indicated on the left. Well 1 : Reference IL-1 p (100 ng); well 2: culture 
supernatant of the transformant pXKN18 (without IL-1|3 cassette); well 3: culture supernatant of 
the transformant pXPHOS treated with endo-N-acetylglucosamidase H; wells 4 and 5: 
supernatants of the cultures of the transformants pXPH05 in LPi and HPi medium, respectively. 

Figure 12: Strategy of construction of the plasmid pYG65. 

Figure 13: Strategy of construction of the plasmid pYG70. 

Figure 14: Strategy of construction of the plasmid pYG141. aph: gene coding for 
aminoglycoside 3'-phosphotransferase, which confers resistance to kanamycin; bla: gene coding 
for the p-lactamase which confers resistance to ampicillin. 

Figure 1 5 : Strategy of construction of the plasmid pYG 1 42. 

Tables 1 and 2: Composition of vectors derived from pKWl according to the invention. 
(*) Cloning sites. 

Tables 3, 4 and 5: Transformation by the vectors of the invention of S. cerevisiae, K. 
waltii and different strains of Kluyveromyces, respectively. The stability of the transformants is 
expressed by the percentages of Ura+ cells after 10 generations of growth in nonselective YPD 
medium. The isonuclear strains K. waltii pKWl + and pKWK are CBS 6430 and KW1 8, 
respectively. 

General cloning technique 

The classical methods of molecular biology, such as centrifugation of plasmid DNA in a 
cesium chloride-ethidium bromide gradient, digestion by restriction enzymes, gel 
electrophoresis, electroelution of DNA fragments from agar gels, transformation in E. coli, etc., 
are described in the literature (Maniatis et al., "Molecular Cloning: a Laboratory Manual," Cold 
Spring Harbor Laboratory, Cold Spring Harbor, N.Y., 1986; Ausubel et al. (eds.), "Current 
Protocols in Molecular Biology," John Wiley & Sons, New York 1987). 

In vitro mutagenesis directed by oligodeoxynucleotides is carried out according to the 
method developed by Taylor et al. (Nucleic Acids Res. 13 (1985) 8749-8764) using the kit 
distributed by Amersham. Sequencing of nucleotides is carried out according to the dideoxy 
technique described by Sanger et al. (Proc. Natl. Acad. Sci. USA 74 (1977) 5463-5467). 
Enzymatic amplification of specific DNA fragments is carried out by the PCR ("Polymerase- 
catalyzed Chain Reaction") reaction under the conditions described by Mullis and Faloona 
(Meth. Enzym., 155 (1987) 335-350) and Saiki et al. (Science 230 (1985) 1350-1354), using a 
"DNA thermal cycler" (Peririn-Elmer Cetus) following the recommendations of the 
manufacturer. 
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Examples 

1) Isolation and purification of pKWl 

Strain CBS 6430 is cultured in 2 L of YPG medium (yeast extract 1%, Bactopeptone 1%, 
glucose 2%) with stirring at 26°C for approximately 1 8 h. The cells in the early stationary phase 
are harvested by centrifugation. 13-15 g of cell mass per liter are usually obtained. The cells are 
washed with 150 mL of 1M sorbitol containing 30 mg of zymolyase 20T (Kirin Breweries Co., 
Tokyo). After incubation at 30°C for 1 h, one adds to the suspension of protoplasts 5 mL of 10% 
sodium dodecyl sulfate and 5 mL of 0.5M EDTA, pH 7.0. The mixture is immediately 
vigorously stirred and incubated at 50°C for 1-2 h. Potassium acetate is added to the lysate to 
obtain a final concentration of 1M and the mixture is maintained in ice for 2 h. The precipitates 
formed are eliminated by centrifugation (Sorvall SS34, 15,000 rpm, 30 min). The supernatant, to 
which 2 volumes of 95% ethanol are added, is cooled in ice to precipitate the nucleic acids. The 
precipitates are collected by centrifugation, washed with ethanol at 70%, dried under a vacuum, 
and finely dissolved in 40 mL of 5 x TE (Ix TE is lOmM tris-HCl, ImM EDTA, pH 8). After the 
addition of 40 g of CsCl in 5 mL of ethidium bromide (stock solution of 10 mg/mL), the mixture 
is centrifuged at 60,000 rpm for 6 h (Beckman, rotor 60 Ti). The fluorescent band of the plasmid 
DNA is located below the major band of the chromosomal DNA. The DNA of the plasmid is 
collected and subjected to the second centrifugation cycle in CsCl/ethidium bromide. The 
collected plasmid DNA is mixed with one volume of isopropanol which has first been 
equilibrated with 4M CsCl to eliminate the ethidium bromide. After several extractions with 
isopropanol, the DNA solution is dialyzed against 1 x TE. The volume of the solution can be 
reduced by dialysis against polyethylene glycol 6000 in flakes. 

2) Sequencing and studies of homologies 

Plasmid pKWl was sequenced using the method described by Sanger et al. (Proc. Natl. 
Acad. Sci. USA 74 (1977) 5463-5467). The complete sequence is indicated in Figure 3. 

The absence of a homology between this sequence and that of known plasmids was 
determined by molecular hybridization experiments: pKWl is labeled with 32 P and hybridized 
with the following plasmids, which were first immobilized on a nitrocellulose filter 

- plasmid 2\i from 5. cerevisiae, 

- pSRl , pSB3 and pSB4 from Z rouxii, 

- pSBl and pSB2 from Z bailii, and 
-pKDl from/T. drosophilarum. 

The hybridization was carried out under moderately stringent conditions (0.6M Na + , 
65°C, 18 h); none of the plasmids produced a positive signal of hybridization. 
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The other circular plasmids (pSBl, pSB4) whose sequences have not yet been described 
are also different from pKWl , in the molecular size, the length of the inverted repeats, and in 
their host species. 

3) Constructions of cloning vectors derived from pKWl 

Two types of recombinant molecules were constructed from pKWl . 

3.1 In the first type, different fragments of pKWl (corresponding, for example, to the 
genetic elements of pKWl) were introduced into shuttle vectors, and notably into the vectors 
YIp5 (Struhl et al., Proc. Nat. Acad. Sci USA 76 (1979) 1035) and pKan21, represented in 
Figure 4. 

Plasmid pKan21 was constructed by insertion of the gene aph (Genblock, Pharmacia) 
which confers resistance to kanamycin (G418) in the form of a 1.25 kbp AccI fragment, in the 
Narl site of plasmid pUC19 (Viera and Messing, Gene 19 (1982) 259). Thus, P Kan21 contains, 
in addition to aph, the gene bla which confers resistance to ampicillin and the replication origin 
of ColEl which allows replication in E. coli. The yeasts transformed by the vectors derived from 
pKan21 can be detected by their growth on a medium containing 200 ug/mL of geneticine 
(G418). 

Plasmid YIp5 is a derivative of plasmid pBR322 in which the gene URA3 from S. 
cerevisiae was inserted as a selection marker. The yeast, transformed by the derivatives of YIp5, 
is detected by its growth on a uracil-free medium. In the last case, the host yeast is an auxotroph 
which is deficient in orotidine-monophosphate carboxylase of the uracil synthesis pathway. 

The vectors of this first type are pBNAl , pNEA2, pBNBl/A3, pNEBl, pXXY2 and 
pXXK3 (Table 1 and Figure 4). 

- Vector pBNAl 

pKWl is digested with Bglll and Nhel (see Figure 5) and the DNA fragments are 
separated by electrophoresis. The 2.4-kbp fragment is recovered and inserted by ligation between 
the unique BamHI and Nhel sites in the tetracycline resistance gene of plasmid YIp5 (Yanish- 
Peron et al., Gene 33, 1985, 103-1 19), where the latter was first digested by BamHI and Nhel 
and repurified. The Bgin and BamHI ends are compatible for a specific ligation. E. coli, 
transformed by the ligation mixture, is selected on LB agar medium which contains ampicillin. 
The insertion is verified by replication of the transformants on LB agar medium containing 
tetracycline, as the latter are sensitive to this antibiotic. The structure of the plasmid is verified 
by extraction of the DNA from individual transformants and its analysis using restriction 
enzymes. For example, plasmid pBNAl, digested by PstI, produces 3 fragments of 3.28, 3.15 
and 1.36 kbp: double digestion with Pstl/Nhel yields 4 fragments of 3.15, 2.3, 1.36 and 1.0 kbp. 
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- Vector pNEA2 

The 2.0 kbp Nhel-EcoRI fragment of pKWl (see Figure 5) is isolated and inserted 
between the two unique Nhel and EcoRI sites in the tetracycline resistance gene of YIp5, where 
the latter was first digested by these two enzymes. The ligation product is introduced into E. coli 
and the transformants which are resistant to ampicillin and sensitive to tetracycline are isolated. 
The plasmid is isolated, as in the case of pBNAl, from one of its transformants. The structure of 
the recombinant plasmid obtained is verified by restriction. For example, digestion by PstI 
produces 2 fragments of 4.35 and 3.15 kbp; double digestion with Pstl/Xhol produces 4 
fragments of 3.15, 1.8, 1.75 and 0.7 kbp. 

- Vector pXXY2 

The 545 bp Xhol-Xbal fragment of pKWl (see Figure 5) is isolated and inserted between 
the unique Sall-Nhel sites in the tetracycline resistance gene of plasmid YIp5. The Xhol and Sail 
ends, on the one hand, and Xbal and Nhel ends, on the other hand, are compatible for a specific 
ligation. The ligation product is introduced into E. coli, and the recombinant plasmid is isolated 
as in the case of pBNAL The structure of the plasmid obtained is verified by restriction. For 
example, digestion with EcoRI + Nrul produces two fragments of 4.5 and 0.96 kbp. 

- Vector pXXK3 

The 545 bp Xhol-Xbal fragment of pKWl (see Figure 5) is isolated and inserted between 
the unique Sall-Xbal sites (polylinker at the N terminal of LacZ) of plasmid pKan21. The 
ligation mixture is introduced into E. coli, and the transformants, which are plated on LB 
medium containing X-gal and IPTG, are isolated as white colonies among blue colonies. When 
replicated on LB medium containing kanamycin, they grow well. These colonies are individually 
analyzed for their plasmid content. The plasmid obtained from one of the transformants presents 
the structure shown in Figure 6, which was verified by restriction. For example, digestion with 
BamHI + PstI produces four fragments: 2.5, 1.3, 0.55 and 0.19 kbp. 

- Vector pBNBl/A3 

The 1.9 kbp Bglll-Nhel fragment of pKWl (see Figure 5) is isolated and inserted 
between the BamHI-Nhel sites of YIp5. The recombinant plasmid is isolated as in the case of 
pBNAl. The structure of the plasmid is verified by restriction. For example, digestion with PstI 
produces 3 fragments of 3.15, 2.8 and 1.36 kbp; double digestion with Pstl/Nhel produces 4 
fragments of 3. 15, 1.8, 1.36 and 1.0 kbp. 
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- Vector pNEBl 

The 2.5 kbp Nhel-EcoRI fragment of pKWl (see Figure 5) is isolated and inserted 
between the Nhel-EcoRI sites of YIp5. The recombinant plasmid is isolated as in the case of 
pBNAl. The structure of the plasmid is verified by restriction. For example, digestion with PstI 
produces 2 fragments of 4.65 and 3.15 kbp; double digestion with Pstl/Xhol produces 3 
fragments of 3.15, 2.9 and 1.75 kbp. 

3.2 The second type of recombinant molecules contains the totality of the sequence of 
pKWl. To obtain these vectors, pKWl is linearized by a unique cut at a restriction site, allowing 
the introduction of heterologous DNA segments. Such segments can contain structural genes, 
included, for example, in expression cassettes and/or whole shuttle vectors, such as, notably, 
pKan2 1 or YIp5 (Figure 4). 

Examples of this type of vectors are pKWCl 1, pKWSl and pKWS14 (Table 2 and 
Figure 7). 

- Vector pKWS14 

The DNA of pKWl is digested by the restriction enzyme Sail. Plasmid pKan21, 
described above, is also digested by Sail (the unique Sail site is localized in the cloning multisite 
present in the LacZ gene). The two plasmids are ligated by DNA ligase. The ligation mixture is 
used for the transformation of E. coli JM83 as in the preceding case. The suspension of the cells 
transformed is plated on LB agar containing X-gal and IPTG. The white colonies, among the 
blue ones, are harvested individually. They are resistant to ampicillin and kanamycin. Their 
plasmid content is analyzed on DNA minipreparations as above. Plasmid pKWS14, isolated from 
one of the transform ants, contains form A of plasmid pKWl and it has the structure shown in 
Figure 7. It is verified by restriction. For example, digestion with BamHI produces 3 fragments 
of5.6,2.6andl.2kbp. 

- Vector pKWCll 

Plasmid pKWl is digested with Clal. Plasmid pKan21 is digested with Accl. They are 
repurified by treatment with phenol and precipitation with ethanol. The DNA of the two 
plasmids are mixed in approximately equal quantities and subjected to ligation with DNA ligase 
for one night The ligation product is amplified in E. coli. The colonies of the transformants are 
white on LB medium containing Xgal and IPTG. They are resistant to kanamycin and ampicillin 
in the medium containing one or the other of these antibiotics. Plasmid pKWCl 1, isolated from 
one of the transformants, contains form A of plasmid pKWl and has the structure shown in 
Figure 7. It is verified by restriction. For example, digestion of the plasmid with BamHI 
produces 3 fragments of 5.6, 2.9 and 0.9 kbp. 
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- Vector pKWSl 

Plasmid pKWl and plasmid YIp5 are digested with Sail. The mixture is repurified and 
subjected to ligation. The ligation product is introduced into E. coli. Transformants which are 
resistant to ampicillin and sensitive to tetracycline are obtained. Plasmid pKWSl, isolated from 
one of them, contains form A of plasmid pKWl and it has the structure shown in Figure 7. For 
example, digestion of the plasmid with EcoRI yields two fragments of 8.3 and 2.7 kbp. 

4) Construction of a strain CBS 6430 pKWl" 

K. waltii CBS 6430 was first transformed by the recombinant plasmid pKWS14 (Table 2 
and Figure 7). The transformation method used is essentially that described by Chen and 
Fukuhara (Gene 69, 1 81 (1988)) using protoplasts. The transformants obtained are maintained 
for 75 generations on YPD agar medium 1 mg/mL G418 (YPD medium: yeast extract 10 g/L; 
peptone 20 g/L; glucose 20 g/L). They are then transferred to a liquid YPD medium without 
antibiotic, and maintained for 10 generations. 

Under these conditions (without selective pressure), plasmid pKWS14 is progressively 
lost. The colonies which are sensitive to G418 and which appear are collected and individually 
tested for the presence of the plasmids. The test consists of the extraction of cellular DNA, 
followed by electrophoresis of these DNAs on agar gel. The presence of plasmids is determined 
by staining with ethidium bromide. Among the colonies which have become sensitive to G41 8, 
25% were shown to lack any plasmid. One of these colonies was kept as a strain of AT. waltii 
which lacked plasmid pKWl, and it was called KW18. 

5) Transformation of different yeasts 

5.1 Transformation of & cerevisiae 

Among the different vectors described in Tables 1 and 2 and in Figures 4 and 5, some of 
those containing the marker URA3 were used to transform an auxotrophic strain ura3 of S. 
cerevisiae (strain S150-2B: Mat a, ura3, leu2, trpl, his3, 2\i). 

The transformation method is essentially the one described by Sherman et al. (Y east 
Genetics, Cold Spring Harbor, NY, 1986). 

The results obtained are indicated in Table 3. They show that the vectors of the invention 
are capable of transforming the yeasts of the genus Saccharomyces. 

5.2 Transformation of K. waltii 

The transformation of AT. waltii was carried out with vectors which cany the marker for 
kanamycin resistance. 
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The transformation method used is essentially the one described by Chen and Fukuhara 
(Gene 69 (1988) 181) using protoplasts. It is clear that any other technique which allows the 
introduction of a DNA fragment in a microorganism can be used. 

The results obtained are presented in Table 4. 

They show that the vectors of the invention are capable of transforming the yeast K. 
waltii with a high frequency. 

Moreover, the stability study described in Figure 8 shows that vectors can be obtained 
from pKWl presenting a stability of 100% after 50 generations of growth in a nonselective 
medium. This is perfectly illustrated by vector pKWCl 1 . This study also shows that it is 
preferable, to obtain a relatively high stability, to use the vectors which comprise only the 
replication origin of plasmid pKWl in host cells having a resident pKWl plasmid. 

5.3 Transforation of other yeasts 

Vector pKWCl 1 , which is highly stable and autonomous in K. waltii, was used to test the 
transferability of different yeast species, notably those belonging to the genus Kluyveromyces. 

The results are presented in Table 5. 

The presence of vector pKWCl 1 in the transformants was verified by electrophoresis. 
All of these results show that the range of host species for the vectors of the invention can 
be very large, beyond the genus Kluyveromyces. 

6) Use of the vectors of the invention for the production of heterologous proteins 
6.1 Interleukin-ip: 

6.1.1 Construction of an expression and secretion vector of IL-lp derived from pKWl 
(Figures 9 and 10). 

- Vector pXXK3 (Table 1 , Figure 6) is linearized by EcoRl, and the ends are filled with 
the Klenow fragment of DNA polymerase I of E. coli. A synthetic "linker" (5'-GCGGCCGC-3') 
forming a restriction site which is recognized by the enzyme NotI is added by means of T4 
ligase, and the vector so obtained (pXKNl 8) is purified after its amplification in E. coli 
(Figure 10). 

- An expression cassette of IL-ip is prepared, consisting (a) of the regulated promoter 
PHOS originating from S. cerevisiae (Bajwa et al., NucL Acid. Res. 12 (1984) 7721-7739), (b) 
the gene of human IL-lp (Jung et al., Ann. Inst. Pasteur/Microbiol. 139 (1988) 129-146) 
preceded (c) by a synthetic sequence corresponding to the signal sequence of the killer toxin of 
pGKLl of K. lactis (pre region of the gene of the alpha subunit) (Stark and Boyd, EMBO J. 5, 
(1986) 1995-2002), and (d) by the terminator PHOS. The expression cassette was isolated from 
the vector pSPH05-IL14 whose construction is described in the patent EP 361991. The cassette 
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was prepared as follows: At the 5' end of the gene coding for the mature part of IL-1 p, the 
following synthetic sequence is inserted, in the form of an EcoRI fragment: 

MetAsnllePheTyrnePheLeuPheLeuLeitSerPbeValGlnGlyLysArg 

5'-AATTATGAATATATrrTACATATTTTTGTTTTTGCT'GTCATTCCTTCAAGGTAAAAG-3' 
J-TACTTATATAAAATGTATAAAAACAAAAACGACAGTAAGCAAGTrCCA 1 1 1 1 1. J J AA-5" 

The last codons added (Lys and Arg) form a potential restriction site which is recognized 
by the endopeptidase Kexl ofK. lactis (Tanguy-Rougeau et al.; FEBS Lett. 234 (1988) 464). 
This sequence was fused to the IL-1 p gene by the EcoRI site, forming the following junction: 

Gly Lys Arg He His Met Ala 
5-....GGT AAA AGA ATT CAT ATG GCA 3" 

Alanine (GCA) corresponds to the first amino acid of mature IL-1 p. Arg-Ile-His-Met 
corresponds to an EcoRI-Ndel "linker" introduced to facilitate the cloning (see EP 361 991). 

The entire cassette is put in the form of a NotI fragment by the addition of a 
corresponding linker (5'-GCGGCCGC-3'). 

- The secretion cassette of IL-ip is inserted, at the NotI site, in pXKN18. The resulting 
vector is called pXPH05 (Figure 10). 

6.1 .2 The strain K. waltii CBS 6430 is transformed with vector pXPHOS, under the 
conditions described in Example 5.2. 

6. 1 .3 Expression of IL- 1 p : 

The transformed cells are cultured at 28°C, in the absence of G41 8, in the liquid medium 
LPi (low mineral phosphate content) and the medium HPi (high phosphate content), prepared 
according to Chen and Fukuhara (Gene 69 (1988) 181-192), for 4 days. 50 mL of culture are 
centrifuged and the supernatants are filtered through a Millipore membrane (0.22 um). The 
proteins are precipitated by the addition of ethanol at the final concentration of 60%. The 
precipitates are dissolved in 2 mL of Laemmli buffer (Nature 227 (1970) pp. 680-685) and 
20-uL samples are used for SDS-PAGE analysis according to Laemmli (document cited above). 
After the electrophoresis, the proteins are transferred to a nitrocellulose sheet, and treated with a 
polyclonal anti-human IL-1 p rabbit antiserum. The blot is then treated with a second biotinylated 
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anti-rabbit polyclonal antibody (Vectastain ABC ImmunoPeroxydase Kit, Vector Laboratories). 
The antigen-antibody complex is developed according to the protocol of the supplier. 

Figure 1 1 shows that a protein having an apparent molecular weight of 21 kDa is secreted 
by the yeast transformed by pXPH05. The protein is specifically recognized by the anti-IL-1 p* 
antiserum. This protein is not synthesized by the yeast transformed by the control vector 
pXKN18 (without IL-1(3 cassette). The secreted protein corresponds to the glycosylated form of 
IL-1 p\ which is demonstrated by the reduction of the apparent MW after treatment with the 
enzyme endo-N-acetylglucosamidase H (Figure 1 1 , lane 3). This host/vector pair K. 
waltii/pXPHOS, which is not yet optimized, secretes approximately 5 mg of IL-1 p per liter of 
culture. The level of secretion of IL-lp by K. waltii is higher in the LPi medium than in the HPi 
medium, which suggests that the activity of the PH05 promoter is regulated by the phosphate in 
K. waltii y as in S. cerevisiae. 

6.2 Human serum albumin: 

6.2.1 Construction of plasmid pYG 140 (Figures 12-14). 
A plasmid was constructed which comprises: 

- an E. coli replicon, 

- the gene aph under the control of the promoter kl of the killer toxin of K. lactis 
(EP36191 1) in which the Hindlll site was eliminated by directed mutagenesis, and 

- the gene bla, which confers resistance to ampicillin. 

- the gene aph, under the control of the promoter kl , is isolated from plasmid pKan707 
(EP361991) in the form of a fragment PstI, which is cloned in the equivalent site of the phage 
M13mp7. The resulting plasmid is called pYG64 (Figure 12). The Hindffl site present in this 
gene was destroyed by direct mutagenesis according to the method described by Taylor et al. 
(Nucl. Acid. Res. 13 (1985) 8749). The resulting plasmid is called pYG65. The 
oligodeoxynucleotide having served for the mutagenesis has the following sequence: 5'- 
GAAATGCATAAGCTCTTGCCATTCTCACCG-S', and it allows the transformation of the 
triplet CTT coding for leucine 1 85 in CTC. To construct plasmid pYG70, the part containing the 
bacterial replicon of vector pKan707 was isolated by digestion with the enzyme EcoRI and 
recircularization with T4 DNA ligase to obtain pYG69. The fragment PstI present in the latter 
vector containing gene aph was then replaced by the mutated equivalent fragment originating 
from pYG65. The resulting plasmid is called pYG70 (Figure 1 3). 

This plasmid is then digested by EcoRI and relegated in the presence of an EcoRI-Narl- 
EcoRI adapter containing the following sequence: 5'-AATTCGGCGCCG-3\ 
The plasmid obtained is called pYG140 (Figure 14). 



19 



6.2.2 Introduction of an expression cassette for albumin (Figure 14) 

The gene coding for preproSAH under the control of the promoter and the terminator of 
the gene PGK of S. cerevisiae was isolated in the form of an Sall-SacI fragment from an 
expression vector pYG19 (EP361991). This fragment was introduced into the corresponding 
sites of plasmid pYG140 to generate plasmid pYG141. 

6.2.3 Construction of expression vector pYG142 (Figure 15) 

Plasmids pYG141 and pKWl are digested by the enzymes Narl and Clal, respectively. 
After the ligation, 4 recombinant plasmids are obtained because of the existence of 2 forms, A 
andB, ofpKWl, and of the orientation of the pKWl part with respect to the pYG 141 part. 

Figure 15 describes the restriction map of one of these 4 plasmids: pYG142, containing 
theformBofpKWl. 

The other plasmids are called pYG143, pYG144 and pYG145. 

One sample of the strain K. lactis CBS 6430 was deposited at the CBS in Baarn 
(Netherlands) pursuant to the conditions of the Treatise of Budapest, on June 4, 1991 under Hie 
number CBS 290.91. 



Table 1 



Vectors 


Fragment of pKWl 


Shuttle vector 


Marker 


pBNAl 


Bglll-Nhel 


Yip5 


URA3 


2.4Kb 


*BamHI-NheI 




pNEA2 


Nhel-EcoRI 


Yip5 


URA3 


2.0kb 


Nhel-EcoRI 




pXXY2 


Xhol-Xbal 


Yip5 


URA3 


0.55 kb 


Sall-Nhel 




pXXK3 


Xhol-Xbal 


pKan21 


Kan R 


j 0.55 kb 


Sall-Xbal 




pBNBl/A3 


Bgllll-Nhel 


Yip5 


URA3 


! 1.9 kb 


BamHI-Nhel 




pNEBl 


Nhel-EcoRI 


Yip5 


URA3 ! 


2.5 kb 


Nhel-EcoRI 
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Table 2 



Vectors 


Linearization site of 
pKWl 


bnuttie vector 


Mancer 


pKWS14 
Pkwcll 
PKWS 1 


Sail 
Clal 
Sail 


pKan21*(SalI) 
P Kan21 (AccI 
Yip5 (Sail) 


Kan R 
Kan R 
URA3 



Table 3. Transformation of Saccharomyces cerevisiae by vectors derived from pKWl 



Vectors 


Transform ants Ura+ per pg of DNA 


pKWSl 


4 400 


pBNAl 


1 200 


pBNBl/A3 


7 600 


pXXY2 


4 000 


pSKl 


4 500 



Table 4. Transformation of Kluyveromyces waltii by vectors derived from pKWl 



Vectors 


Replication support 


Transform ants G 
per pgof 

pKWl + 


418-resistant 
DNA 

pKWl" 


pKWCll 
pXXK3 
pKWS14 


pKWl total 

Xbal-Xhol 
540bpdepKWl 
pKWl total 


36 00 
(98 %) 
35 000 
(49 %) 
10 000 
(92 %) 


8 000 
(100 % 
10 000 
(2,8%) 

8 000 
(29 %) 


Table 5. Transforms 


Son of yeasts of the genus Kluyveromyces with t 


he vector pKWCll 


Species 


Strain 


GC% 


Frequency of 
transformation 
per pg of DNA 


Stability of the 
transformants 

(%) 


K. waltii 

K. thermotolerans 


CBS 6430 
CBS 6340 


45.6 
46.2 


2400 
4000 


100 

25 
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Claims 

1 . Plasmid pKWl isolated from the strain K. waltii CBS6430, or any fragment or 
derivative thereof. 

2. Fragment according to Claim 1, characterized in that it is a genetic element. 

3. Plasmid characterized in that it comprises all or part of the sequence presented in 
Figure 3 or a derivative thereof. 

4. Cloning and/or expression vector, characterized in that it comprises all or part of 
plasmid pKWl of K. waltii CBS 6430 represented in Figure 1 or a derivative thereof. 

5. Vector according to Claim 4, characterized in that it comprises a genetic element of at 
least plasmid pKWl . 

6. Vector according to Claim 5, characterized in that it comprises the replication origin of 
plasmid pKWl. 

7. Vector according to Claim 4, characterized in that it comprises the totality of plasmid 

pKWl. 

8 . Vector according to Claim 4, characterized in that it comprises all or part of the 
sequence presented in Figure 3 or a derivative thereof. 

9. Vector according to Claim 4, 7 or 8, characterized in that plasmid pKWl is linearized 
at the level of a functionally neutral restriction site. 

10. Vector according to Claim 9, characterized in that it contains restriction site present 
on plasmid pKWl, or one which was artificially introduced to it. 

1 1 . Vector according to Claim 10, characterized in that it contains a restriction site 
artificially introduced into an intergenic region, and preferably in the region located between the 
genes B and D, or in the region located between gene D and IR2. 

12. Vector according to Claim 10, characterized in that plasmid pKWl is linearized at the 
level of the sites Clal(l), Pstl(4608) or EcoRV(3072), the positions being given with reference to 
Figure 3. 

13. Vector according to any one of Claims 4-12, characterized in that it contains, in 
addition, a heterologous DNA sequence comprising a structural gene which is at least under the 
control of signals allowing its expression. 

14. Vector according to Claim 13, characterized in that the expression signals consist of 
one or more elements chosen from promoters, terminators, and secretion signals. 

15. Vector according to Claim 14, characterized in that the promoters can be regulated. 

16. Vector according to Claim 14, characterized in that the promoters are derived from 
yeast genes, and preferably from glycolytic yeast genes. 

17. Vector according to Claim 13, characterized in that the structural gene codes for a 
polypeptide of pharmaceutical or agro-food interest. 
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18. Vector according to Claim 13, characterized in that the structural gene codes for a 
hybrid protein. 

19. Vector according to Claim 13, characterized in that the structural gene(s) is (are) 
genes involved, at the genetic or biochemical level, in the biosynthesis of a metabolite. 

20. Vector according to Claim 4, characterized in that it contains in addition an E. coli 
replicon. 

21 . Vector according to Claim 4, characterized in that it contains in addition at least one 
selection marker. 

22. Recombinant cell containing a vector according to any one of Claims 4-21. 

23. Cell according to Claim 22, characterized in that it is a yeast cell. 

24. Cell according to Claim 23, characterized in that it is a yeast of the genus 
Kluyveromyces or Saccharomyces. 

25. Method for the preparation of a polypeptide, characterized in that a recombinant cell 
is cultured according to one of Claims 22-24 and the produced polypeptide is recovered. 

26. Method according to Claim 25, characterized in that the polypeptide is chosen from 
enzymes (such as, notably, superoxide dismutase, catalase, amylases, lipases, amidases, 
chymosine, etc.), blood derivatives (such as serum albumin, alpha- or beta-globin, factor VIII, 
factor DC, van Willebrand factor, fibronectin, alpha-1 antitrypsin, etc.), insulin and its variants, 
lymphokines (such as interleukins, interferons, colony stimulation factors (G-CSF, GM-CSF, M- 
CSF. . .), TNF, TRF, etc.), growth factors (such as growth hormone, erythropoietin, FGF, EGF, 
PDGF, TGF, etc.), apolipoproteins, or antigenic polypeptides for the preparation of vaccines 
(hepatitis, cytomegalovirus, Epstein-Barr, herpes, etc.). 

27. Method according to Claim 26, characterized in that the polypeptide is human 
albumin or one of its variants or precursors. 

28. Use of a recombinant cell according to one of Claims 22-24 as a catalyst in a 
byconversion reaction. 
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Figure 2 



I « I 20 | 3<T I 40 I 50 | 60 

1 ATCGATTGCC AGCAACAGGG TTTTGCGCGT ATGTCTCTTG TGGATACTAT GTAAACAAAA 60 
61 CAATCAATGT ACAAAGAGCA CAGCGGCCGG CAGGTGGGAG GACCCTCTGA TGAGCCGGGG 120 
121 ATATGGCGCT CCCGCGCGTC TAATATCCGG ATTGGACTGG AGGAGGACCA AGGTTTCCTC 180 
181 GAGGTCATGT GCCGCATCAT GAGGGACGAA AAATGGTAAG GAATAGACCA TTCCTTACCA 240 
241 TTTTTCGTCG CCCGTGAGAT TTTCCCATTT CCCGTTCCTT ACCATTTTTC GTTCCGCACG 300 
301 ACCCTATCAC ATTGTATATT GAAATCTACT TCCCTTCATA CCGCTTGGCC ATCGCGTAGG 360 
361 AATGAACATA TGTAGCCCCT CTAGTTCCTC ATGTTGTTCT CAATCGACCC TTCCATCGTG 420 
421 AAGGGATCTC CTCTTGAGGC AATGTCGACG TTCGTACCCT CTTCCTACGG GTCACGGGTT 480 
481 CGTCTGTAAC ACTTCTTCTT GGTCTCCCTC GGCCTCTTTT ACTTGGCTGT GGCCTGGTAT 540 
541 TTTTGAGTTC ATCGAATAGG CGCGGGTTTT CTTTXACTTG AGGCCAGTCT TGAATCTCTG 600 
601 AACCGAGAGA GGTTAGAGAA GTTATTCTTT TTAGATCATT TAACATGTCC TTGATGTCTT 660 
661 CTGGCGTTGT TTCGAAGCAC ATCAGTCCCC TTGAGCGATA TCTGTCGTAA TTTGCCAGTA 720 
721 TTACGTTGTG CGCTTCTTCC ATGTTTTCAG GGGCCACATG CTTTAATGCC TGCACTAAAA 780 
781 CACTTCTGAC AAGTGACCAA TCTGCGAATG CAGGCTCGTT CGCCAATATC AATCTCTGTA 840 
841 GAGGAACACC ACGATAGCTT GTTGTGCCCT TGCAGATAGT GTTCAAGAAT AGACTGAGGT 900 
901 AGCCACGTAC GTCGAGCTTT ACAGACCTGG TGCCAACGCC AGAAAGAAGG GCGAAGGGGT 960 
961 CCTCTTCAAT CGGAAAACGG GTCAGGCTAT CCACACGGTA CTCTCTATAT GTACTACGAG 1020 
1021 TCATCGTCGT GTACTTTGCG AAGTGCAGGC CGTGGCGATT ATAGTCAATC TGGAAAGAAT 1080 
1081 CCTGCTCATG TGGCTCTTTC TCCCCATTAT CCTCTTCAGA GTTCAGCGAG CCAGATGGCA 1140 
1141 GCTCGGCTGG CTCTCGCAGG TACGTGGGAT CGGGCTCACC TCGATCCACC GTCATCTCAT 1200 
1201 CAAGATTGCA CATAATCTGC ATCAGTCTCA ACGTCATATC GACCGCGGAA AAGGCGTCCG 1260 
1261 AGTAGGAAAC ATGCAGTTTG GAAAGGTCTA ACAGCTTGAG GCAGTGCATC TTGGCCTCTC 1320 
1321 TCTCTGTCAG TCTTTCTCTG TTTTGACCAA TTTTTCTCAA GTGTATTACA TTTGTTTCTT 1380 
1381 GGATTGCAAA AATGTTGCGA GTACTGCGTG TTCTCGXTCA AAAACAGCGT TCGCTGAAAA 1440 
1441 TTTAGGAGTT CAGATGCAAC GCGTAGTGCA AATGGAGGAT TCAAGTTGCA GTAACAATAA 1500 
1501 CATGGAACAC CAAGGATCAG TGTTCGAGGA GCTTATCTCC AAAAATCTTA TGAGCCTGAT 1560 
1561 GGAAGAATTG ATGTCTATGC TCACTAATGA GAAGGAGTTC CAACGTGAAA GGTTCGCGTC 1620 
1621 TCTCCTAGCC TACATGATAA TGGCTACTGG TGAATTGGAA GAGAAAAAGC TCAGTACATT 1680 
1681 TACCAAGTAT TCCCGACGGA TCAGGCAGAC GGTAGAGTTC GACAGCAACA ACCAAATCGT 1740 
1741 AAGATTTGAG TACCATTTGA AGAATCCCAC AGAGCTCAAG GAGACGCTGG ACAAGGCCTT 1800 
1801 TAAACCTGTC GTGTTTGAAA TCAAGTCCAA AAAGAAGGTT GTCTCCATGC TGGAGCTAGC 1860 
1861 TGCGAAGCTC GACAAAAGGG GATCAGATTC AGCGGGTGGT ACGGTAGCTA GTGAGGTCTC 1920 
1921 GAAGCTTGTG CGGGAGGAAG AAATTTGGCT TCTTCTCGTG AACGTGAAGA ATACTATCCA 1980 
1981 GGAAAAGGTG CGCAAATCAT CGCTAAGAGC GGAATTGACG TATATTTTGA CAGCCTCATT 2040 
2041 CTTCAATTGT TGCAGACATA GCGATCTCAG GAACGCAGAC CCCGCAACAT TTGAGCTGGT 2100 
2101 GCCAAATAAG TATGTGGGCC ACGTTGTCCG GGTTTTGGTG TGCGAGACCA AGACCCGAAA 2160 
2161 GCCGCGGTTC ATATACTTTT TCCCTGTCAA TACGGCCGCG GATCCTCTAG TAGCGCTTCA 2220 
2221 TGArTTGTTC TCGAGCACGT TTCCTTCCAA AAAGAGTCGG ACGTCCGAAA GAAAGCAGGA 2280 
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2281 ACAGGAATGG CAGATCGTTC GCGACGCATC *AATCAACAAC TATGACCGGT TTGTTGGTAA 2340 
2341 GCACGCTACG GAATCTGTCT TTGCCATCTT GCATGGTCCC AAATCACACT TGGGCCGGCA 2400 
2401 CTTGATGAGT TCCTACTTGG CGTATACCCA CCATGGGGAA TGGGTCTCAC CATATGGGAA 2460 
2461 TTGGTCAGCT GGGAAAGGAA CCATTGAAAG CAGCGTGGCA AGGGCCAAGT ACGCACATGT 2520 
2521 TCAAGCCGAG ATCCCAAGCG ATCTTTTCGC CTTTCTGTCT CAGTACTATC AGGAATCAAA 2580 
2581 ATCGGGCGAT TTCGAGCTTA ACGACACCAG CAAAGACCCA ACAAAGCTGG TACGGCACTC 2640 
2641 GGCTAGTCAA CTGGAAATCA ATCGAACCTA TGGTCCATGG AGTAGATTGG TTAACAAGGA 2700 
2701 TGTTTTAGGC TTTGTTCATT CCTACGC5AT GGCCAAGCGG TATGAAGGGA AGTAGATTTC 2760 
2761 AATATACAAT GTGATAGGGT CGTGCGGAAC GAAAAATGGT AAGGAACGGG AAATGGGAAA 2820 
2821 ATCTCACGGG CGACGAAAAA TGGTAAG6AA TGGTCTATTC CTTACCATTT TTCGTCCCTC 2880 
2881 ATGATGCGGC ACATGACCTC GAGGAAACCT TGGTCCTCCT CCAGTCCAAT CCGGATATTA 2940 
2941 GACGCGCGGG AGCAGCCTAT CCCCGGCTCA TCAGAGGGTC CTCCCACCTG CCGGCCGCTG 3000 
3001 TGCTCTTTGT ACATTGATTG TTTTGTTTTA GTATTACCTG ACAATCATTT TATATTTTGT 3060 
3061 CAGTATTTCT TGATATCTGG CCCAAATGAA AGTACAAATA CAAGTACAAG TACAACACCT 3120 
3121 ATTCATTGTT ACCGTATCTC TATACTATTA TCCTTATTTC CTGCCTAATT AACTACTTrC 3180 
3181 TACCGGTGCG TTCTTAAAGC TGAGTAGGCA CTTCAGCCCG AAGTGAATAT CGCTGGCCTC 3240 
3241 ATTATCTGTT TGTTGTATGG CCAATGAAAC TCCAACCGAT TTGATCCACT TGCAAGGACC 3300 
3301 GTAGGATAGA CTTATTTTTA CCATCCCATT ATCTGTGCAG TGGACACCTC TGTTTATCTT 3360 
3361 TACCCGCCCT TCAGAGAACA TAATCTGTCT TACAAAAGAG TAGACCTCAT TTTTGGCGAG 3420 
3421 AAGCCTCTTC TGTTTGACCT CATCTAGAAG CTTTTGGGCT CTCCCAGCGC AATCAGATAG 3480 
3481 TCTTGTGAGA GTGTCCTCTT CGTCACCATG CTCATCAGAA GGAGCTGGTT GCGTTCCAAT 3540 
3541 TGAGAAAGCT CGTCCCAAAA GGCTGCATGG TCTATAGGTG GTCCCGAACC CGAGGATTCA 3600 
3601 CCTTGAGACT CATTGTCCAC AGTAGGCTCC TGATCCTCTG CAGCAGCCGC TTGCTGAATG 3660 
3661 GATTCTGCTC TTGACATTAC CATTTCGAGA AGCCATAGTC TTCGGATGGT TCTAGCAGAT 3720 
3721 CTTTCAACAT CCAAACTGGA ACCGAACCAT TGCCGACAAC TTATTCTAAC CTCAAGCTTT 3780 
3781 GAGAGGTTCT CATACTTGGA TTGTGCAGCC TCAAGATCCG TAAGTTCGGT GAAGAAATCT 3840 
3841 AAAGCTTCGC GTTTTGGACC TAACCGAATG ATGATTGGGT GCCGTTTTCG TGGATCCAGA 3900 
3901 AATGGTGTAA GCTCCTCTAT ACTATCATTC GTGGGACACT CTATCCCTTC CCCAATATGC 3960 
3961 TTCTTTACAA TAGAAGGTAG CTGCGTATAC TTGTTCCGAA CAACAAAGAT GTGACTCTCT 4020 
4021 AGCCGCTTTA CTATTGTGTT CAACACAACG TAGGGTTTTG GCCACTCAAA TGTTAATTCT 4080 
4081 GATCGAGGTG CTGATGCTGT GTTCTTGTTG ATCATGTATG AATAGTAGAA CAATGCCAAT 4140 
4141 TGAGGATGCT CACTGTATTC CTTAGGCAGT TTGGTGCTGC CATAAGGTGA CACCAGCTCC 4200 
4201 TTTAGCTGTG GAACATAGAG TACATCAACA GTTCCTACTA GACAACATTC CTTGAGACAA 4260 
4261 TTATGATAGC CATCATGGTC GGTTATCTTA GGTATTTTTT GAGCTTCACT CATCTTCGAA 4320 
4321 GCAACCGTGA TAGATTCGAT TGAAGTTCAA ATTCTTATCT AGATGGTGTA TTTGTTTATC 4380 
4381 ATAATTTACA ATACAGTCTG TTTTAATTTG CTCGAAGTTG CAGTGAAAGA TGTAAAAAGG 4440 
4441 GGCTTCATTT TGCACTACAG ACTTACCCTG ATGTAAAAAA TTTTCATCAT AAAAGCAATT 4500 
4501 TCTCGTATAC AAAATGCAGT TTGTTTCGTA TACAGCAAAG CATAGAATAC ACTGTACACT 4560 
4561 GCATTTTTAC TACAAGAAAA GTTTT1TTTG CTGCTGTGAC TGGAATGCTG CAGCAGTACC 4620 
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4621 TAGATAGAAA AATGGCATAA AACTGAAATT TTATAGTCAT TTTTCGTGTC TTTCATTCAA 4680 
4681 TTTTTTCTCG CAAAAGTTTT CTACAAAAGC AGTCAAAATT GCAATAAGTA TACACTAATT 4740 
4741 ACAAGGCGTC TGAGCGCGTG ACTTGAGCGC GTGACGTAAT CGCGAGCTAC GAAAGTTGTT 4800 
4801 TGGGCCTCAG ACATCGGATC GACAGAAGAG GTAAGAATAT TGGGAAAGTA CATTCAATTA 4860 
4861 CCACAACAAT CGAGAGATTA GTGGAATTCA GTCATTAATG AAAGGTAGGG TAGTCCGCCT 4920 
4921 ACTCTTAGTT CTACATTCAG AATACGCATG CAGTCCTCAA GTTCTGATGA AGACGACCTA 4980 
4981 ATTGACCCTA TAATTCATCC CAAATCGTTC TATAGGGCGG CTAACGAGAT ACCGAGAGAC 5040 
5041 TTTTTGGTTG CGATCCCCAT CAGCGCCTAT GTTTTTAGCG TATTTGCTAA ATCAGTACGA 5100 
5101 GATGACTTAC AGGGGCATTT AACGGCGCGA GATATGGCAT TAGCTTATCG TGAACGGCAG 5160 
5161 TACTTTCACA GACGCTGGGA GACACGAAAC GACCAGCTTG AGATCCCAGA CTGGTCTGAG 5220 
5221 ATCCCAGAAT GGTCTCTCGG GTTACTGGAT CGCCCTCCTT GTATCACTGT GGATCTAGCA 5280 
5281 AGAGAACTGC GCGAACTATC TCAAAAATGG ATCGGAGCAT TCGATCTGGG ATCGAAGATG 5340 
5341 TCTGGCAGGC TTCTTCTACA GCTTCTGTAC ACCCAGCTGT CATGCCCAAA TGAGGCTGTT 5400 
5401 TTCAATAAGC TTTACTGCCT CGTCAAACTA CTAAACAAGG ACGTAAATCG TGCGGACCGA 5460 
5461 GCCCTTATGG ACTCTGTATT GAGACCACTT TTTGTCGAGA ATCCATACAT GGGTGAACTA 5520 
5521 GATGAAGAAA TACTTGATAA GATATGGTCC AATTTGACTG AAATGAGAAG TCAAGAGTGG 5580 
5581 AAACGTATAG CGGAAGCGTT GTCAGGCGAG AATAATGAC 56l9 
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